Workflow zur statistischen Analyse und zum Verfassen von Berichten

Hat jemand Kenntnisse über Workflows für die Datenanalyse im Zusammenhang mit benutzerdefinierten Berichtserstellungen? Der Anwendungsfall ist im Grunde:

Der Kunde gibt einen Bericht in Auftrag, der eine Datenanalyse verwendet, z. eine Bevölkerungsschätzung und zugehörige Karten für ein Wasserviertel.

Der Analyst lädt einige Daten herunter, mischt die Daten und speichert das Ergebnis (z. B. Hinzufügen einer Spalte für die Bevölkerungszahl pro Einheit oder Untersetzen der Daten basierend auf Bezirksgrenzen).

Die Analystin analysiert die in (2) erstellten Daten, nähert sich ihrem Ziel, stellt jedoch fest, dass mehr Daten erforderlich sind, und geht daher auf (1) zurück.

Wiederholen Sie den Spülvorgang, bis die Tabellen und Grafiken der Qualitätskontrolle entsprechen und den Kunden zufrieden stellen.

Schreiben Sie einen Bericht mit Tabellen und Grafiken.

Nächstes Jahr kommt der zufriedene Kunde zurück und möchte ein Update. Dies sollte so einfach wie das Aktualisieren der Upstream-Daten durch einen neuen Download (z. B. Holen Sie sich die Baugenehmigungen des letzten Jahres) und Drücken einer Schaltfläche "RECALCULATE" (Neu berechnen) sein, sofern sich die Spezifikationen nicht ändern.

Im Moment starte ich nur ein Verzeichnis und ad-hoc es so gut ich kann. Ich würde gerne systematischer vorgehen, also hoffe ich, dass jemand dies herausgefunden hat ... Ich verwende eine Mischung aus Tabellenkalkulations-, SQL-, ARCGIS-, R- und Unix-Tools.

Vielen Dank!

PS:

Im Folgenden finden Sie ein grundlegendes Makefile, das nach Abhängigkeiten von verschiedenen Zwischendatensätzen sucht (w /.RData Suffix) und Skripte (.R Suffix). Make verwendet Zeitstempel, um Abhängigkeiten zu überprüfentouch ss07por.csvwird angezeigt, dass diese Datei neuer ist als alle Dateien / Ziele, die davon abhängen, und führen Sie die angegebenen Skripte aus, um sie entsprechend zu aktualisieren. Dies ist noch in Arbeit, einschließlich eines Schritts zum Einfügen in die SQL-Datenbank und eines Schritts für eine Template-Sprache wie sweave. Beachten Sie, dass Make sich in seiner Syntax auf Registerkarten stützt. Lesen Sie daher das Handbuch, bevor Sie ausschneiden und einfügen. Viel Spaß und Feedback geben!

http://www.gnu.org/software/make/manual/html_node/index.html#Top

R=/home/wsprague/R-2.9.2/bin/R

persondata.RData : ImportData.R ../../DATA/ss07por.csv Functions.R
   $R --slave -f ImportData.R

persondata.Munged.RData : MungeData.R persondata.RData Functions.R
      $R --slave -f MungeData.R

report.txt:  TabulateAndGraph.R persondata.Munged.RData Functions.R
      $R --slave -f TabulateAndGraph.R > report.txt

Antworten auf die Frage(3)

Ihre Antwort auf die Frage