gitphp 0.2.9.1 :: disclosr.git/commitdiff

FOI stats importer fixed

Former-commit-id: 81a6a149848e27565b7a7052d2a7ff4e5aaa9310

33 files changed: (show all)
admin/importOAICFOIrequests.php
admin/massdelete.sh (new)
admin/refreshDesignDoc.php
documents/about.php
documents/agency.php
documents/charts.php
documents/genericScrapers.py
documents/index.php
documents/rss.xml.php
documents/runScrapers.sh
documents/scrape.py
documents/scrapers/0e46f8bd1414b1fdd4f0543d54a97500.py
documents/scrapers/1803322b27286950cab0c543168b5f21.py
documents/scrapers/1d404c4934f74feacd00dcb434e7c10a.py
documents/scrapers/227cb6eb7d2c9f8a6e846df7447d6caa.py
documents/scrapers/41a166419503bb50e410c58be54c102f.py
documents/scrapers/53d2884f8afd026096a27bd5051ec50e.py
documents/scrapers/5716ce0aacfe98f7d638b7a66b7f1040.py
documents/scrapers/601aedeef4344638d635bdd761e9fdba.py
documents/scrapers/69d59284ef0ccd2677394d82d3292abc.py
documents/scrapers/8c9421f852c441910bf1d93a57b31d64.py
documents/scrapers/8e874a2fde8aa0ccdc6d14573d766540.py
documents/scrapers/ad033512610d8e36886ab6a795f26561.py
documents/scrapers/be9996f0ac58f71f23d074e82d44ead3.py
documents/scrapers/bf16d4ba0d306ee03e5a1d32aaba3da1.py
documents/scrapers/d1296c366287f7a9faedf235c7e6df01.py
documents/scrapers/e2a845e55bc9986e6c75c5ad2c508b8d.py
documents/scrapers/f5ce2d1651739704634eb8ca4b2b46d3.py
documents/sitemap.xml.php
documents/template.inc.php
graph.php
include/common.inc.php
ranking.php

file:a/admin/importOAICFOIrequests.php -> file:b/admin/importOAICFOIrequests.php

<?php	<?php

require_once '../include/common.inc.php';	require_once '../include/common.inc.php';

$db = $server->get_db('disclosr-agencies');	$db = $server->get_db('disclosr-agencies');
$rows = $db->get_view("app", "byName")->rows;	$rows = $db->get_view("app", "byName")->rows;
$nametoid = Array();	$nametoid = Array();
$stats = Array();	$stats = Array();
foreach ($rows as $row) {	foreach ($rows as $row) {
$nametoid[trim($row->key)] = $row->value;	$nametoid[trim($row->key)] = $row->value;
}	}
$row = 0;	$row = 0;
$headers = Array();	$headers = Array();
// source: http://data.gov.au/dataset/freedom-of-information-quarterly-request-and-review-statistical-data-2011-12/	// source: http://data.gov.au/dataset/freedom-of-information-quarterly-request-and-review-statistical-data-2011-12/
if (($handle = fopen("FOI-quarterly-requests-and-reviews-2011-12.csv", "r")) !== FALSE) {	if (($handle = fopen("FOI-quarterly-requests-and-reviews-2011-12.csv", "r")) !== FALSE) {
while (($data = fgetcsv($handle, 10000, ",")) !== FALSE) {	while (($data = fgetcsv($handle, 10000, ",")) !== FALSE) {
if ($row >= 1) {	if ($row >= 1) {
// print_r($data);	// print_r($data);
$name = trim($data[2]);	$name = trim($data[2]);
echo "$name <br>";	// echo "$name <br>";
if ($data[0] != "TOTALS" && $data[0] != "") {	if ($data[0] != "TOTALS" && $data[0] != "") {
if (isset($nametoid[$name])) {	if (isset($nametoid[$name])) {
$id = $nametoid[$name];	$id = $nametoid[$name];
$timePeriod = $data[0] . "-Q" . $data[1];	$timePeriod = $data[0] . "-Q" . $data[1];

echo "$timePeriod <br>";	// echo "$timePeriod <br>";
unset($data[0]);	unset($data[0]);
unset($data[1]);	unset($data[1]);
unset($data[2]);	unset($data[2]);
unset($data[3]);	unset($data[3]);
unset($data[4]);	unset($data[4]);
unset($data[5]);	unset($data[5]);
unset($data[6]);	unset($data[6]);
unset($data[7]);	unset($data[7]);
unset($data[8]);	unset($data[8]);

//echo $id . "<br>" . PHP_EOL;	//echo $id . "<br>" . PHP_EOL;
$result = Array("source" => "http://data.gov.au/dataset/freedom-of-information-quarterly-request-and-review-statistical-data-2011-12/");	$result = Array("source" => "http://data.gov.au/dataset/freedom-of-information-quarterly-request-and-review-statistical-data-2011-12/");
foreach ($data as $key => $datum) {	foreach ($data as $key => $datum) {
if ($datum != 0) {	if ($datum != 0) {
	// tODO prefix header with "FOI"
	if (isset($stats[$id][$timePeriod][$key])) $datum += $stats[$id][$timePeriod][$key];
$result[trim($headers[$key])] = $datum;	$result[trim($headers[$key])] = $datum;
}	}
}	}
$stats[$id][$timePeriod] = $result;	$stats[$id][$timePeriod] = $result;
	// TODO merge if already exists
//print_r($stats);	//print_r($stats);
} else {	} else {
echo "<br>ERROR NAME MISSING FROM ID LIST<br><bR> $row" . PHP_EOL;	echo "<br>ERROR NAME MISSING FROM ID LIST<br><bR> $row" . PHP_EOL;
print_r($data);	print_r($data);
die();	die();
}	}
}	}
} else {	} else {
$headers = $data;	$headers = $data;
//print_r($headers);	//print_r($headers);
}	}
$row++;	$row++;
}	}
fclose($handle);	fclose($handle);
}	}
	echo "all stats loaded successfuly";
foreach ($stats as $id => $stat) {	foreach ($stats as $id => $stat) {
echo $id . "<br>" . PHP_EOL;	echo $id . "<br>" . PHP_EOL;
$doc = $db->get($id);	$doc = $db->get($id);
echo $doc->name . "<br>" . PHP_EOL;	echo $doc->name . "<br>" . PHP_EOL;
print_r($stat);	// print_r($stat);
die();
// print_r($doc);	// print_r($doc);
$changed = false;	$changed = false;
if (!isset($doc->statistics)) {	if (!isset($doc->statistics)) {
$changed = true;	$changed = true;
$doc->statistics = Array();	$doc->statistics = Array();
	} else {
	$doc->statistics = object_to_array($doc->statistics);
}	}
foreach ($stat as $timePeriod => $value) {	foreach ($stat as $timePeriod => $value) {
if (!isset($doc->statistics->foiRequests->$timePeriod)	if (!isset($doc->statistics["foiRequests"][$timePeriod])
\|\| $doc->statistics->foiRequests->$timePeriod != $value) {	\|\| $doc->statistics["foiRequests"][$timePeriod] != $value
	) {
$changed = true;	$changed = true;
$doc->statistics["foiRequests"][$timePeriod] = $value;	$doc->statistics["foiRequests"][$timePeriod] = $value;
}	}
}	}
if ($changed) {	if ($changed) {
$db->save($doc);	$db->save($doc);
} else {	} else {
echo "not changed" . "<br>" . PHP_EOL;	echo "not changed" . "<br>" . PHP_EOL;
}	}
	//print_r($doc);die();
}	}
?>	?>

file:b/admin/massdelete.sh (new)

	for line in `curl "http://localhost:5984/disclosr-foidocuments/_design/app/_view/byAgencyID?reduce=false&keys=%5B\"5716ce0aacfe98f7d638b7a66b7f1040\"%5D&limit=600" \| xargs -L1`; do
	# echo $line
	id=`echo $line \| grep -Po '_id:.*?[^\\\],' \| perl -pe 's/_id://; s/^//; s/,$//'`
	rev=`echo $line \| grep -Po 'rev:.*?[^\\\],'\| perl -pe 's/rev://; s/^//; s/,$//'`
	if [ -n "$id" ]; then
	echo "curl -X DELETE http://localhost:5984/disclosr-foidocuments/$id?rev=$rev"
	curl -X DELETE http://localhost:5984/disclosr-foidocuments/$id?rev=$rev
	fi
	done;

file:a/admin/refreshDesignDoc.php -> file:b/admin/refreshDesignDoc.php

<?php	<?php

require_once '../include/common.inc.php';	require_once '../include/common.inc.php';
//function createFOIDocumentsDesignDoc() {	//function createFOIDocumentsDesignDoc() {

$foidb = $server->get_db('disclosr-foidocuments');	$foidb = $server->get_db('disclosr-foidocuments');
$obj = new stdClass();	$obj = new stdClass();
$obj->_id = "_design/" . urlencode("app");	$obj->_id = "_design/" . urlencode("app");
$obj->language = "javascript";	$obj->language = "javascript";
$obj->views->all->map = "function(doc) { emit(doc._id, doc); };";	$obj->views->all->map = "function(doc) { emit(doc._id, doc); };";
$obj->views->byDate->map = "function(doc) { if (doc.title != \"Disclosure Log Updated\") { emit(doc.date, doc); } };";	$obj->views->byDate->map = "function(doc) { if (doc.title != \"Disclosure Log Updated\") { emit(doc.date, doc); } };";
$obj->views->byDateMonthYear->map = "function(doc) { emit(doc.date, doc); };";	$obj->views->byDateMonthYear->map = "function(doc) { emit(doc.date, doc); };";
$obj->views->byDateMonthYear->reduce = "_count";	$obj->views->byDateMonthYear->reduce = "_count";
$obj->views->byAgencyID->map = "function(doc) { emit(doc.agencyID, doc); };";	$obj->views->byAgencyID->map = "function(doc) { emit(doc.agencyID, doc); };";
$obj->views->byAgencyID->reduce = "_count";	$obj->views->byAgencyID->reduce = "_count";
$obj->views->fieldNames->map = 'function(doc) { for(var propName in doc) { emit(propName, doc._id); }}';	$obj->views->fieldNames->map = 'function(doc) { for(var propName in doc) { emit(propName, doc._id); }}';
$obj->views->fieldNames->reduce = 'function (key, values, rereduce) { return values.length; }';	$obj->views->fieldNames->reduce = 'function (key, values, rereduce) { return values.length; }';
// allow safe updates (even if slightly slower due to extra: rev-detection check).	// allow safe updates (even if slightly slower due to extra: rev-detection check).
$foidb->save($obj, true);	$foidb->save($obj, true);


//function createDocumentsDesignDoc() {	//function createDocumentsDesignDoc() {
$docdb = $server->get_db('disclosr-documents');	$docdb = $server->get_db('disclosr-documents');

$obj = new stdClass();	$obj = new stdClass();
$obj->_id = "_design/" . urlencode("app");	$obj->_id = "_design/" . urlencode("app");
$obj->language = "javascript";	$obj->language = "javascript";
$obj->views->web_server->map = "function(doc) {\n emit(doc.web_server, 1);\n}";	$obj->views->web_server->map = "function(doc) {\n emit(doc.web_server, 1);\n}";
$obj->views->web_server->reduce = "_sum";	$obj->views->web_server->reduce = "_sum";
$obj->views->byAgency->map = "function(doc) {\n emit(doc.agencyID, 1);\n}";	$obj->views->byAgency->map = "function(doc) {\n emit(doc.agencyID, 1);\n}";
$obj->views->byAgency->reduce = "_sum";	$obj->views->byAgency->reduce = "_sum";
$obj->views->byURL->map = "function(doc) {\n emit(doc.url, doc);\n}";	$obj->views->byURL->map = "function(doc) {\n emit(doc.url, doc);\n}";
$obj->views->agency->map = "function(doc) {\n emit(doc.agencyID, doc);\n}";	$obj->views->agency->map = "function(doc) {\n emit(doc.agencyID, doc);\n}";
$obj->views->byWebServer->map = "function(doc) {\n emit(doc.web_server, doc);\n}";	$obj->views->byWebServer->map = "function(doc) {\n emit(doc.web_server, doc);\n}";

$obj->views->datasets->map = "function(doc) {\nif (doc.fieldName == \"data\") {\n emit(doc._id, doc);\n}\n}";	$obj->views->datasets->map = "function(doc) {\nif (doc.fieldName == \"data\") {\n emit(doc._id, doc);\n}\n}";
$obj->views->datasetGroups->map = "function(doc) {\nif (doc.fieldName == \"data\") {\n doc.metadata[\"data.gov.au Category\"] && doc.metadata[\"data.gov.au Category\"].forEach(function(tag) {\n emit(tag, doc.url); \n });\n}\n}";	$obj->views->datasetGroups->map = "function(doc) {\nif (doc.fieldName == \"data\") {\n doc.metadata[\"data.gov.au Category\"] && doc.metadata[\"data.gov.au Category\"].forEach(function(tag) {\n emit(tag, doc.url); \n });\n}\n}";
$obj->views->getValidationRequired->map = "function(doc) {\nif (doc.mime_type == \"text/html\" \n&& typeof(doc.validation) == \"undefined\") {\n emit(doc._id, doc._attachments);\n}\n}";	$obj->views->getValidationRequired->map = "function(doc) {\nif (doc.mime_type == \"text/html\" \n&& typeof(doc.validation) == \"undefined\") {\n emit(doc._id, doc._attachments);\n}\n}";
$docdb->save($obj, true);	$docdb->save($obj, true);