Social Mirroring
Ziel dieses Projekt ist es, Graphen von
- Benutzern und (facebook, studivz, ...)
- deren Interessen (flickr, digg, technorati, del.icio.us, ...)
- und weiteren Attributen (location, age, ...)
zu erstellen, diese zu visualisieren und die Zusammenhänge zwischen den sozialen- und Attributnetzen zu analysieren.
Die Architektur implementiert dafür drei Komponenten:
- Eine Facebook Applikation zum Mining von sozialen Netzen
- Dataminingapplikationen zur Abfrage von flickr, del.icio.us, ...
- ein Applikation zur Visualisierung der Ergebnisse
Arbeitsaufteilung
Jede am Projekt mitarbeitende Person, sollte im Zuge des Projektes mit zumindest einer der folgenden Kernaspekten befasst sein:
- Technische Aspekte: Facebook-Applikation, Web-Interface, technorati-Spider, Visualisierung, ...
- Organisatorische Aspekte: Zeitplan, Organisation von Treffen, Projektdokumentation, ...
- Strategische Aspekte: Planung, Modellierung, Marketing, Aufteilung der Workpackages, rechtliche Aspekte ...
Es wird empfohlen, jeweils Zweierteams mit den entsprechenden Tätigkeiten zu betrauen. Im Zuge des Projektes sollte jede Woche ein anderes Zweierteam den aktuellen Stand des Projektes berichten.
Tracking
Mögliche Tracking Quellen sind:
- facebook (friends, photos)
- technorati
- del.icio.us
- flickr
- digg
- Amazon reviews
- IMDB reviews
3. Minimalanforderungen an die Teilapplikationen
Achtung: die Applikationen müssen so geschrieben sein, dass zu keinen Zeitpunkt ein Mapping zwischen den Datenbankeinträgen und Personen möglich ist.
gruppe 1 - facebook
--------------------------------------
- erstellen und verteilen einer facebook applikation
- einhaltung von allen rechtlichen bestimmungen (datenschutz, ...)
- marketing der applikation (entsprechend grosser benutzerkreis)
- auswahl der zu verwendeten felder
- anonymisierung von allen personenbezogenen daten
gruppe 2 - external services
--------------------------------------
- integration in den facebook data-stream, annotation von personendaten
- annonymisierung aller personenbezogenen daten
- recherche: mögliche nützliche datenquellen
- implementierung von mehreren dieser quellen: zum beispiel: del.icio.us, flickr, ...
- integration dieser quellen in die core-applikation
gruppe 3 - retrieval und spidering
---------------------------------------
- web applikation zum zugriff auf die knowledge base
- anzeigen und tracking von anonymisierten benutzerdaten
- visuelle darstellung des mappings zwischen eigenschaften (del.icio.us tags, geschlecht, ...) und benutzern am besten mittels graphviz
- definition von fertigen abfragen; möglichkeit via webinterface individuelle abfragen zu definieren
- ausgabe von statistiken
- csv import/export