10 Phänomenale Ressourcen für Open Data

10 Phänomenale Ressourcen für Open Data - Dummies

Offene Daten sind Teil eines größeren Trends hin zu einem weniger restriktiven, offeneren Verständnis der Idee des geistigen Eigentums, ein Trend, der in den letzten zehn Jahren enorm an Popularität gewonnen hat. Open data sind Daten, die öffentlich zugänglich gemacht wurden und dürfen verwendet, wiederverwendet, erstellt und mit anderen geteilt werden. Offene Daten sind Teil der offenen Bewegung.

Über offene Daten hinaus umfasst diese treffend benannte Open-Bewegung auch Open-Source-Software, offene Hardware, Open-Content-Kreativarbeit, offenen Zugang zu wissenschaftlichen Zeitschriften und offene Wissenschaft. Inhalte (einschließlich Rohdaten aus Experimenten) sollten frei geteilt werden können.

Das Unterscheidungsmerkmal offener Lizenzen ist, dass sie Copyleft statt Copyright haben. Bei Copyleft, ist die einzige Einschränkung, dass die Quelle der Arbeit identifiziert werden muss, manchmal mit dem Vorbehalt, dass abgeleitete Werke nicht mit einer restriktiveren Lizenz urheberrechtlich geschützt werden können als das Original. Wenn die zweite Bedingung in Kraft ist, wird eine erfolgreiche Kommerzialisierung der Arbeit selbst schwierig, obwohl die Leute oft viele andere indirekte, kreative Wege der Kommerzialisierung finden.

Beachten Sie, dass manchmal Arbeiten, die als offen gekennzeichnet sind, möglicherweise nicht der akzeptierten Definition entsprechen. Sie sind dafür verantwortlich, die Lizenzrechte und Einschränkungen der von Ihnen verwendeten offenen Daten zu überprüfen.

Die Leute verwechseln oft offene Lizenzen mit Creative Commons-Lizenzen. Creative Commons ist eine gemeinnützige Organisation, die sich der Förderung und Verbreitung kreativer Werke verschrieben hat, indem sie einen rechtlichen Rahmen bietet, durch den Nutzungsrechte gewährt und erhalten werden können, so dass die Parteien beim Bau von Rechtsrisiken sicher sind. auf und verwendet Arbeit und Wissen, das offen geteilt wurde. Einige Creative Commons-Lizenzen sind offen, und einige verbieten explizit abgeleitete Arbeiten und / oder Kommerzialisierung.

Im Rahmen der jüngsten Open-Government-Initiativen haben Regierungen auf der ganzen Welt damit begonnen, offene Regierungsdaten zu veröffentlichen. Regierungen stellen diese Daten allgemein zur Verfügung, damit sie von freiwilligen Analysten und Bürgern verwendet werden können - Programmierern, die gemeinsam Open Source-Lösungen entwickeln, die offene Daten zur Lösung sozialer Probleme nutzen - um die Gesellschaft zu unterstützen. groß. Im Jahr 2013 haben die G8-Staaten (Frankreich, die Vereinigten Staaten, das Vereinigte Königreich, Russland, Deutschland, Japan, Italien und Kanada) eine Charta unterzeichnet, in der sie sich zur Offenlegung von Daten verpflichten und die Bereiche nationale Statistiken, Wahlergebnisse, Staatshaushalte, und nationale Karten.

Die Open-Government-Bewegung fördert die Transparenz und Rechenschaftspflicht der Regierung, pflegt eine gut informierte Wählerschaft und fördert das öffentliche Engagement. Vereinfacht ausgedrückt, erleichtert Open Government eine Lese-Schreib-Beziehung zwischen einer Regierung und ihren Bürgern.

Durchsuchen von Daten. gov

Die Daten. Das Gov-Programm wurde von der Obama-Regierung gestartet, um einen offenen Zugang zu nicht klassifizierten US-Regierungsdaten zu ermöglichen. Daten. Regierungsdaten werden von allen Abteilungen der Exekutive - dem Weißen Haus und allen Kabinettsabteilungen - sowie von Datensätzen aus anderen Regierungsebenen erstellt. Bis Mitte 2014 könnten Sie mithilfe der Daten nach über 100 000 Datensätzen suchen. gov Suche. Die Website ist eine beispiellose Ressource, wenn Sie nach US-Regierungsdaten für die folgenden Indikatoren suchen:

  • Wirtschaftlich
  • Umweltfreundlich
  • MINT-Branche
  • Lebensqualität
  • Rechtlich

Auschecken Canada Open Data

Wenn Sie einen Blick auf die Website von Canada Open Data werfen, ist das starke Engagement der Nation für Daten offensichtlich. Auf der Canada Open Data Website finden Sie über 200 000 Datensätze. Zu den 25 beliebtesten Angeboten auf der Canada Open Data-Site gehören Datensätze, die die folgenden Indikatoren abdecken:

  • Umwelt
  • Staatsbürgerschaft
  • Lebensqualität

Eintauchen in Daten. reg. Großbritannien

Das Vereinigte Königreich hat in der Open-Government-Bewegung einen späten Start hingelegt. Daten. reg. Großbritannien wurde 2010 gestartet, und bis Mitte 2014 waren nur noch etwa 20 000 Datensätze verfügbar. Wie Daten. Regierung, Daten. reg. Großbritannien wird auch vom CKAN-Datenkatalog betrieben.

Obwohl Daten. reg. Großbritannien spielt immer noch Aufholjagd, es verfügt über eine beeindruckende Sammlung von Ordnance Survey-Karten, die alt genug sind - 50 Jahre oder mehr -, um nicht urheberrechtlich geschützt zu sein. Wenn Sie nach weltberühmten, frei verwendbaren Umfragemaps, Daten suchen. reg. Großbritannien ist ein unglaublicher Ort für Sie zu erkunden. Jenseits seiner stellaren Übersichtskarten, Daten. reg. Großbritannien ist eine nützliche Quelle für Daten zu den folgenden Indikatoren:

  • Umwelt (das produktivste Thema von data. gov. uk)
  • Staatsausgaben
  • Gesellschaft
  • Gesundheit
  • Bildung
  • Wirtschaft und ökonomisch

US Census Bureau-Daten auschecken

Die US-Volkszählung findet alle zehn Jahre statt, und seit 2010 sind die Daten frei verfügbar. Statistiken sind bis auf die Ebene des Zensusblocks verfügbar - im Durchschnitt werden 30 Personen gezählt. Die vom US Census Bureau bereitgestellten demografischen Daten können äußerst hilfreich sein, wenn Sie Marketing- oder Werbeforschung betreiben und Ihre Zielgruppe nach den folgenden Klassifikationen ansprechen müssen:

  • Alter
  • Durchschnittliches Jahreseinkommen
  • Haushaltsgröße < Geschlecht oder Rasse
  • Bildungsniveau
  • Kenntnis der NASA-Daten

Seit ihrer Gründung im Jahr 1958 hat die NASA alle nicht klassifizierten Projektdaten veröffentlicht. Es war so lange im Open-Data-Spiel, dass die NASA Tonnen von Daten hat! NASA-Datensätze sind mit den jüngsten Verbesserungen in der Satelliten- und Kommunikationstechnologie noch schneller gewachsen. Tatsächlich erzeugt die NASA pro Tag 4 Terabyte neue erdwissenschaftliche Daten - das entspricht mehr als einer Million MP3-Dateien.Viele der NASA-Projekte haben Daten im Petabyte-Bereich gesammelt.

Das offene Datenportal der NASA heißt Daten. Dieses Portal ist eine Quelle für alle Arten von wunderbaren Daten, einschließlich Daten über

Astronomie und Raum (natürlich!)

  • Klima
  • Biowissenschaften
  • Geologie
  • Ingenieurwissenschaften
  • Ringen um Weltbankdaten

Die Weltbank ist eine internationale Finanzinstitution der Vereinten Nationen. Sie stellt Entwicklungsländern Kredite zur Verfügung, um Kapitalinvestitionen zu finanzieren, die (man hofft) auf Armutsbekämpfung und einen gewissen Überschuss hinausläuft, damit die Empfängerländer die Darlehensbeträge im Laufe der Zeit zurückzahlen können. Weil Weltbank-Offiziere gut informierte Entscheidungen darüber treffen müssen, welche Länder ihre Kredite eher zurückzahlen, haben sie enorme Datenmengen über die Mitgliedsstaaten gesammelt. Sie haben diese Daten auf der Seite Open Data der Weltbank der Öffentlichkeit zugänglich gemacht.

Wenn Sie nach Daten suchen, die Ihre Argumentation in einem wirklich interessanten Datenjournalismus stützen, der von globalen Statistiken unterstützt wird, sollte die Weltbank Ihre Quelle sein. Egal, welchen Umfang Ihr Projekt hat, wenn Sie Daten über Entwicklungen in Entwicklungsländern benötigen, ist die Weltbank der richtige Ort. Sie können die Website verwenden, um ganze Datensätze herunterzuladen oder einfach die Datenvisualisierungen online anzuzeigen. Sie können auch die Open Data API der Weltbank verwenden, um auf Ihre Bedürfnisse zuzugreifen.

Open Data der Weltbank liefert Daten zu folgenden Indikatoren (und vielen, vielen mehr):

Landwirtschaft und ländliche Entwicklung

  • Wirtschaft und Wachstum
  • Umwelt
  • Wissenschaft und Technologie
  • Finanzsektor < Armutseinkommen
  • Weltbankdaten umfassen auch
  • Mikrodaten

- Stichprobenerhebungen von Haushalten und Unternehmen in Entwicklungsländern. Sie können Mikrodaten verwenden, um Variationen in Ihren Datensätzen zu untersuchen. Knoema-Daten kennenlernen Knoema (ausgesprochen "No-mah") behauptet, das größte Repository für öffentliche Daten im Internet zu sein. Auf der Knoema-Plattform befinden sich neben den 150 Millionen

Zeitreihen

- 150 Millionen Datensammlungen von Attributwerten im Zeitverlauf über 500 Datenbanken. Knoema umfasst, ist aber nicht beschränkt auf, alle diese Datenquellen: Regierungsdaten aus Industrienationen Nationale öffentliche Daten aus Entwicklungsländern

  • Daten der Vereinten Nationen
  • Daten der internationalen Organisation
  • Unternehmensdaten aus Globale Konzerne
  • Knoema ist eine hervorragende Ressource, wenn Sie internationale Daten über Landwirtschaft, Kriminalstatistik, Demographie, Wirtschaft, Bildung, Energie, Umwelt, Ernährungssicherheit, Außenhandel, Gesundheit, Landnutzung, Landesverteidigung, Armut, Forschung und Entwicklung, Telekommunikation, Tourismus, Transport oder Wasser.
  • Knoema ist nicht nur eine unglaubliche Datenquelle, sondern auch eine vielseitige Einsatzplattform. Mit der Knoema-Plattform können Sie Dashboards erstellen, die automatisch alle Ihre Lieblingsdatensätze verfolgen. Sie können die Datenvisualisierungstools der Plattform verwenden, um Ihre Daten schnell und einfach in einem Tabellen- oder Kartenformat anzuzeigen.Sie können den Knoema-Datenatlas verwenden, um einen Drilldown zwischen Kategorien und / oder geografischen Regionen durchzuführen und schnell auf die gewünschten Datensätze zuzugreifen. Als Einzelperson können Sie Ihre eigenen Daten hochladen und Knoema als kostenlosen Hosting-Service nutzen. Darüber hinaus bietet Knoema sogar den Knoema-Markt an - ein Ort, an dem Sie nur für die Teilnahme an datengesteuerten Projekten bezahlt werden können.

Obwohl viele Daten von Knoema ziemlich allgemein sind, können Sie immer noch einige überraschend spezifische Daten finden. Wenn Sie Schwierigkeiten haben, Daten zu einem bestimmten Thema zu finden, haben Sie vielleicht Glück, es auf der Knoema-Plattform zu finden. Die Abbildung zeigt, wie spezifisch Knoema-Daten sein können.

Der Index der Insektenaufzeichnungen in Knoemas Suche.

Quandl mit Quandl-Daten

Quandl ist eine Website mit Sitz in Toronto, die als Suchmaschine für numerische Daten dienen soll. Im Gegensatz zu den meisten Suchmaschinen wird die Datenbank jedoch nicht automatisch von Spidern erzeugt, die das Web crawlen. Es konzentriert sich vielmehr auf verknüpfte Daten, die über

Crowdsourcing

aktualisiert werden - mit anderen Worten, manuell über menschliche Kuratoren aktualisiert. Da die meisten Finanzdaten im numerischen Format vorliegen, ist Quandl ein ausgezeichnetes Werkzeug, um auf dem neuesten Stand der Informatik zu bleiben. Wie Sie sehen können, liefert eine Suche nach Apple

über 4 700 Datensätze aus 11 verschiedenen Quellen mit Zeitreihen auf Tages-, Wochen-, Monats-, Quartals- oder Jahresbasis. Viele dieser Ergebnisse beziehen sich auf die Agrardaten der Vereinten Nationen. Wenn Sie nach Daten auf Apple Computern suchen, können Sie den Umfang Ihrer Suche eingrenzen, indem Sie den Suchbegriff Apple durch die Unternehmens-Abkürzung AAPL ersetzen. Der Index von Apple zeichnet in der Quandl-Suche auf. Die Quandl-Datenbank enthält Links zu mehr als 10 Millionen Datensätzen (obwohl sie eine großzügige Metrik verwenden, um zu deklarieren, was ein Dataset von einem anderen unterscheidet). Quandl verweist auf 2,1 Millionen UN-Datensätze und viele andere Quellen, einschließlich Datensätzen im Open Financial Data Project, den Zentralbanken, Immobilienorganisationen und bekannten Think Tanks.

Exploring Exversion Data

Nach GitHub modelliert - die Cloud-gehostete Plattform, über die Programmierer Code gemeinsam nutzen und überprüfen können - zielt Exversion darauf ab, die gleiche kollaborative Funktionalität rund um Daten bereitzustellen, die GitHub für Code bereitstellt. Die Exversion-Plattform bietet Funktionen zur Versionskontrolle und Hosting-Dienste, auf die Sie Ihre Daten hochladen und weitergeben können. Um zu veranschaulichen, wie Exversion funktioniert, stellen Sie sich eine Plattform vor, die es Ihnen ermöglichen würde, ein Dataset zuerst

abzuteilen

(oder zu kopieren) und dann die gewünschten Änderungen vorzunehmen. Exversion wäre da, um zu verfolgen, was sich vom ursprünglichen Set geändert hat, und jede Änderung, die Sie daran vornehmen. Mit Exversion können Benutzer Datasets bewerten, überprüfen und kommentieren. Auf der Exversion-Plattform gehostete Datensätze werden entweder von einem Benutzer bereitgestellt oder von einem Spider erstellt, der offene Daten crawlt und indiziert, damit sie über eine einzige Anwendungsprogrammierschnittstelle (API) durchsucht werden können.Wie GitHub sind alle Daten, die Sie zu Exversion hochladen, mit einem kostenlosen Benutzerkonto öffentlich. Wenn Sie bereit sind, für ein Konto zu bezahlen, können Sie eigene, private Datenrepositorys erstellen. Mit dem kostenpflichtigen Konto haben Sie außerdem die Möglichkeit, Ihre Daten mit ausgewählten Nutzern für gemeinsame Projekte zu teilen. Kartierung von OpenStreetMap Spatial Data

OpenStreetMap (OSM) ist eine offene, Crowdsourcing-Alternative zu kommerziellen Kartenprodukten wie Google Maps und ESRI ArcGIS Online. In OSM erstellen, hochladen oder digitalisieren Benutzer geografische Daten in das zentrale Repository.

Die OSM-Plattform ist ziemlich robust. Regierungen und private Unternehmen haben begonnen, zu den geteilten Datensätzen beizutragen. Sogar große Unternehmen wie Apple vertrauen auf OSM-Daten. OSM hat jetzt mehr als 1 Million registrierte Benutzer. Um zu veranschaulichen, wie eine Person Daten in OSM erstellen kann, stellen Sie sich vor, dass jemand die GPS-Systeme seines Mobiltelefons mit der OSM-Anwendung verknüpft. Durch diese Autorisierung kann OSM automatisch die Wege von Straßen verfolgen, während die Person reist. Später kann diese Person (oder ein anderer OSM-Benutzer) in die OSM-Online-Plattform gehen, um die Routen zu verifizieren und zu beschriften.

Die Daten in OSM werden nicht als Karten, sondern als geometrische und Textdarstellungen - Punkte, Linien, Polygone und Kartenanmerkungen - gespeichert, sodass alle OSM-Daten schnell von der Website heruntergeladen und einfach in eine kartographische Darstellung zusammengefügt werden können. über eine Desktop-Anwendung.