English Intern
    Data Science Chair

    Seminar

    Ausgewählte Themen des Web 2.0: Twitter Analyse

    Seminar

    (0815065)

    Microblogging ist eine Art der Kommunikation bei der man kurze Nachrichten schnell und unkompliziert veröffentlichen kann. Es können Benutzer ausgewählt werden, deren Nachrichten man erhält. Die erfolgreichste Microblogging-Platform ist Twitter. Sie wird dazu genutzt Informationen zu verbreiten und diese zu diskutieren. Der Umfang des Inhalts reicht von sehr persönlichen Dingen bis hin zu rein informellen Nachrichten. Diese extreme Vielfalt gepaart mit der großen Anzahl an Benutzern, die in den emergenten sozialen Netzwerken miteinander interagieren, macht Twitter zu einer Basis vielfältiger Analysemethoden und Anwendungen. Diese reichen von der Betrachtung verschiedenster Nutzerstatistiken bis hin zu Anwendungen wie Erdbebendetektion. Im Rahmen dieses Seminars sollen grundlegende Strukturen in Twitter, sowie tiefergehende Analysen und weiterführende Anwendungen behandelt werden.

    Veranstalter:

    <link mitarbeiter hotho external-link-new-window external link in new>Prof. Dr. Andreas Hotho, Martin Becker

    Vorbesprechung/Einstieg:

    Mittwoch, 19.10.2011 um 14 Uhr im Raum B015

    Ablauf des Seminars 

    Es handelt sich um ein Blocksenimar, d.h. Vorträge werde nicht über das Semester verteilt, sondern in einigen wenigen Sitzungen gegen Ende der Vorlesungszeit gehalten. Jeder Votrag behandelt ein spezifisches Thema mit zugehöriger Literatur und erstreckt sich etwa über 30 Minuten. Zu jedem Vortrag muss eine Ausarbeitung, eine Zusammenfassung und ein Foliensatz erstellt werden.

    Bei der Vorbesprechung/Einleitung werden die Themen - so nicht schon vergeben - an die anwesenden Seminarteilnehmer verteilt. Grundsätzlich besteht Anwesenheitspflicht. Teilnehmer, die bereits ein Thema bearbeiten, aber ohne Absprache fehlen, verlieren ihren Anspruch auf ihr Thema. Die Literatur zu einem Thema besteht zumeist aus einem Buchkapitel oder einem Satz wissenschaftlicher Ausätze (Paper).

    Dannach setzt man sich in der Vorbereitungsphase mit dem gewählten Thema auseinander. Die gegebene Literatur wird aufarbeitet. Zuätzlich soll diese durch möglichst aktuelle Literatur ergänzt werden. Die Auswahl der weiteren Literatur trifft der Seminarteilnehmer letztendlich in Absprache mit dem Betreuer.

    Nachdem die Literatur feststeht wird eine Ausarbeitung, eine einseitige Zusammenfassung und ein Foliensatz erstellt.

    Zuletzt wird der Vortrag im Rahmen einer Blockveranstaltung gehalten. Ein Probevortrag ist sinnvoll und erfolgt auf Absprache mit dem jeweiligen Betreuer. Bei jeder Blockveranstaltung gilt Anwesenheitspflicht.

     

    Leistungsnachweis:

    Drei (3!) Tage vor dem geplanten Vortrag sind per Email als PDF abzugeben:

    • - eine 11-12-seitige Ausarbeitung im hier beschriebenen Format (eine Vorlage für LaTeX findet sich hier, die Vorlage für Word ist hier)
    • - eine einseitige Zusammenfassung (die allen Teilnehmern ausgehändigt wird),
    • - der Foliensatz

    Die einseitige Zusammenfassung wird von dem Betreuer drei Tage vor dem Seminarvortrag an alle Teilnehmer gesendet, so dass sich die Teilnehmer auf die vorgetragenen Themen einstellen können. 

    Vorherige Absprachen mit dem Betreuer sind ausdrücklich erlaubt. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags

    "twitter", "seminar", "winter" "2011", "talk", den Tags des jeweiligen Themas und weiteren sinnvollen Tags.

    Die Vortragsdauer beträgt verbindlich 30 Minuten, nach dem Vortrag besteht Gelegenheit zur Diskussion. Der Vortrag (inkl. Folien und Abstract) geht mit 40% in die Endnote ein, die Ausarbeitung ebenfalls mit 40%. Die letzten 20% bewerten die Eigenständigkeit der Ausarbeitung, Einhaltung von Terminen, Beteiligung am Seminar etc.

    Termine

    Die Veranstaltungstermine (Blockseminar) werden in der Vorbesprechung diskutiert. Bei den Terminen stellen die Teilnehmer ihre Ausarbeitungen vor. Sowohl bei der Vorbesprechung als auch bei den Blockveranstaltungen besteht Anwesenheitspflicht.

     

    Bearbeitungshinweise

    Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch

    Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005. 

    empfohlen, welches beim Betreuer des Seminars (<link mitarbeiter hotho external-link-new-window external link in new>Prof. Dr. Andreas Hotho) ausliegt. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.

     

    Weiteres

    Es ist möglich, sich während der Semesterferien bei Prof. Dr. Andreas Hotho oder Martin Becker zu melden, um möglichst zeitnah ein Thema zu erhalten.

     

    Literatur

    Die Gundlage zu den Vorträgen bilden wissenschaftliche Aufsätze (Papers) gruppiert nach Themen, die hier aufgeführt werden.

    • How and why people Twitter: the role that micro-blogging plays in informal communication at work. Zhao, D.; Rosson, M.B. In Proceedings of the ACM 2009 international conference on Supporting group work, pp. 243–252. ACM, 2009.
    • Tweet, tweet, retweet: Conversational aspects of retweeting on twitter. Boyd, D.; Golder, S.; Lotan, G. In hicss, pp. 1–10. IEEE Computer Society, 1899.
    • Neighborhood Based Fast Graph Search in Large Networks. Khan, Arijit; Li, Nan; Yan, Xifeng; Guan, Ziyu; Chakraborty, Supriyo; Tao, Shu. In Conference, International Conference on Management of Data (SIGMOD/PODS 2011), Athens, Greece - June 12 - 16, 2011, pp. 901–912. ACM, New York, NY, USA, 2011.
    • Uncovering social spammers: social honeypots + machine learning. Lee, Kyumin; Caverlee, James; Webb, Steve. In Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, of SIGIR ’10, pp. 435–442. ACM, Geneva, Switzerland, 2010.
    • Measuring user influence in twitter: The million follower fallacy. Cha, M.; Haddadi, H.; Benevenuto, F.; Gummadi, K.P. In 4th International AAAI Conference on Weblogs and Social Media (ICWSM). 2010.
    • What is Twitter, a social network or a news media?. Kwak, H.; Lee, C.; Park, H.; Moon, S. In Proceedings of the 19th international conference on World wide web, pp. 591–600. ACM, 2010.
    • Using twitter to recommend real-time topical news. Phelan, O.; McCarthy, K.; Smyth, B. In Proceedings of the third ACM conference on Recommender systems, pp. 385–388. ACM, 2009.
    • Detecting Spam Bots in Online Social Networking Sites: A Machine Learning Approach. Wang, Alex. In Data and Applications Security and Privacy XXIV, Vol. 6166, S. Foresti, S. Jajodia (eds.), pp. 335–342. Springer Berlin / Heidelberg, Berlin, Heidelberg, 2010.
    • Detecting Spammers on Twitter. Benevenuto, Fabricio; Magno, Gabriel; Rodrigues, Tiago; Almeida, Virgilio. In Proceedings of the Seventh Annual Collaboration, Electronic messaging, Anti-Abuse and Spam Conference (CEAS). Washington, DC, USA, 2010.
    • Don’t follow me: Spam detection in twitter. Wang, Alex H. In Proceedings of the International Conference on Security and Cryptography (SECRYPT). 2010.
    • Uncovering social spammers: social honeypots + machine learning. Lee, Kyumin; Caverlee, James; Webb, Steve. In Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, of SIGIR ’10, pp. 435–442. ACM, Geneva, Switzerland, 2010.
    • Information visualization for the people. Technical Report (PhD dissertation), . Danziger, M. PhD dissertation. MASSACHUSETTS INSTITUTE OF TECHNOLOGY, 2008.
    • Integrating web-based intelligence retrieval and decision-making from the twitter trends knowledge base. Cheong, M.; Lee, V. In Proceeding of the 2nd ACM workshop on Social web search and mining, pp. 1–8. ACM, 2009.
    • TwitInfo: Aggregating and visualizing microblogs for event exploration. Marcus, A.; Bernstein, M.S.; Badar, O.; Karger, D.R.; Madden, S.; Miller, R.C. In Proceedings of the 2011 annual conference on Human factors in computing systems, pp. 227–236. ACM, 2011.
    • Characterizing debate performance via aggregated twitter sentiment. Diakopoulos, N.A.; Shamma, D.A. In Proceedings of the 28th international conference on Human factors in computing systems, pp. 1195–1198. ACM, 2010.
    • Predicting elections with twitter: What 140 characters reveal about political sentiment. Tumasjan, A.; Sprenger, T.O.; Sandner, P.G.; Welpe, I.M. In Proceedings of the Fourth International AAAI Conference on Weblogs and Social Media, pp. 178–185. 2010.
    • Semantic Smoothing for Twitter Sentiment Analysis. Saif, Hassan; He, Yulan; Alani, Harith. In The 10th International Semantic Web Conference (ISWC). Bonn, Germany, 2011.
    • Twitter as a corpus for sentiment analysis and opinion mining. Pak, A.; Paroubek, P. In Proceedings of LREC 2010. 2010.
    • Unsupervised modeling of twitter conversations. Ritter, A.; Cherry, C.; Dolan, B. In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, pp. 172–180. Association for Computational Linguistics, 2010.
    • Detecting Controversial Events from Twitter. Popescu, Ana-Maria; Pennacchiotti, Marco. In Conference, International Conference on Information and Knowledge Management (CIKM 2010), Toronto , ON, Canada - October 26 - 30, 2010, pp. 1873–1876. ACM, New York, NY, USA, 2010.
    • Detecting Spammers on Twitter. Benevenuto, Fabricio; Magno, Gabriel; Rodrigues, Tiago; Almeida, Virgilio. In Proceedings of the Seventh Annual Collaboration, Electronic messaging, Anti-Abuse and Spam Conference (CEAS). Washington, DC, USA, 2010.
    • Earthquake shakes Twitter users: real-time event detection by social sensors. Sakaki, T.; Okazaki, M.; Matsuo, Y. In Proceedings of the 19th international conference on World wide web, pp. 851–860. ACM, 2010.
    • Measuring geographical regularities of crowd behaviors for Twitter-based geo-social event detection. Lee, Ryong; Sumiya, Kazutoshi. In GIS-LBSN, X. Zhou, W.-C. Lee, W.-C. Peng, X. Xie (eds.), pp. 1–10. ACM, 2010.
    • Microblogging during two natural hazards events: what twitter may contribute to situational awareness. Vieweg, S.; Hughes, A.L.; Starbird, K.; Palen, L. In Proceedings of the 28th international conference on Human factors in computing systems, pp. 1079–1088. ACM, 2010.
    • TwitInfo: Aggregating and visualizing microblogs for event exploration. Marcus, A.; Bernstein, M.S.; Badar, O.; Karger, D.R.; Madden, S.; Miller, R.C. In Proceedings of the 2011 annual conference on Human factors in computing systems, pp. 227–236. ACM, 2011.
    • Twitter adoption and use in mass convergence and emergency events. Hughes, A.L.; Palen, L. In International Journal of Emergency Management, 6(3), pp. 248–260. Inderscience, 2009.
    • Earthquake shakes Twitter users: real-time event detection by social sensors. Sakaki, T.; Okazaki, M.; Matsuo, Y. In Proceedings of the 19th international conference on World wide web, pp. 851–860. ACM, 2010.
    • Geography of Twitter networks. Takhteyev, Yuri; Gruzd, Anatoliy; Wellman, Barry. In Social Networks. 2011.
    • Limiting the Spread of Misinformation in Social Networks. Budak, Ceren; Agrawal, Divyakant; El Abbadi, Amr. In Conference, 20th International World Wide Web Conference (WWW 2011), Hyderabad, India - March 28 - April 01, 2011, pp. 665–674. ACM, New York, NY, USA, 2011.
    • Measuring influence on Twitter. Anger, Isabel; Kittl, Christian. In I-KNOW, p. 31. 2011.
    • Measuring user influence in twitter: The million follower fallacy. Cha, M.; Haddadi, H.; Benevenuto, F.; Gummadi, K.P. In 4th International AAAI Conference on Weblogs and Social Media (ICWSM). 2010.
    • Detecting Spam Bots in Online Social Networking Sites: A Machine Learning Approach. Wang, Alex. In Data and Applications Security and Privacy XXIV, Vol. 6166, S. Foresti, S. Jajodia (eds.), pp. 335–342. Springer Berlin / Heidelberg, Berlin, Heidelberg, 2010.
    • Graph Pattern Matching: From Intractable to Polynomial Time. Fan, Wenfei; Li, Jianzhong; Ma, Shuai; Tang, Nan; Wu, Yinghui; Wu, Yunpeng. In Proceedings of the VLDB Endowment, 3(1), pp. 264–275. 2010.

    Einführung

    Ziel dies Vortrags ist es ein grobe Einführing in Microblogging und Twitter zu geben: dazu gehören allgemeine Informationen rund um Microblogging, sowie Twitter-spezifische Informationen. Dies schliesst die Erklärung von Tweets, Retweets, Mentions und Hashtags mit ein.

    Bibsonomy-Tags: introduction

    Aufbau und Strukturen

    Der Aufbau und die Strukturen von Twitter umfassen unter anderem allgmeine Benutzer- und Benutzungsstatistiken, Follower-Netzwerk-Eigenschaften, sowie ortspezifische Verteilungen.

    Bibsonomy-Tags: statistics overview

    Informationfluss und -diffusion

    Informationen verbreiten sich rasend schnell in Netzwerken wie etwa Twitter oder Digg. Dieses Thema soll die charakteristischen Eigenschaften des entsprechenden Effekts anhand verschiedener Beispiele behandeln.

    Dieses Theme überschneidet sich mit "Einflussquellen" was sich auch in der Literaturauswahl widerspiegelt. Dementsprechend muss beim Bearbeiten der Paper der Fokus auf das entsprechende Thema gelegt werden. Gruppenarbeit ist denkbar.

    Bibsonomy-Tags: information flow

    Einflussquellen

    Wie definiert sich "Einfluss" in sozialen Netzwerken. Wie erkennt man einflussreiche Quellen und welche Eigenschaften machen einzelne Benutzer einflussreich? 

    Dieses Theme überschneidet sich mit "Informationfluss und -diffusion" was sich auch in der Literaturauswahl widerspiegelt. Dementsprechend muss beim Bearbeiten der Paper der Fokus auf das entsprechende Thema gelegt werden. Gruppenarbeit ist denkbar.

    Bibsonomy-Tags: influentials

    Einflussmaximierung und -limitierung

    Die Einflussmaximierung kann für Firmen von großem kommerziellen Interesse sein. Dieses Thema soll behandeln wie Einfluss maximiert, jedoch auch wie schlechtem Einfluss entgegengewirkt werden kann.

    Bibsonomy-Tags: influence

    Empfehlungssysteme

    Das Verhalten von Mitgliedern sozialer Netzwerke kann dazu verwendet werden, Empfehlungssysteme zu entwerfen, die dem Benutzer personlisierte Inhalte vorschlagen: entweder im Allgmeinen oder aber im sozialen Netzwerk selber. 

    Hier ist nur ein sehr knappes Paper angegeben. Es muss also vermehrt Literaturrecherche betrieben werden.

    Bibsonomy-Tags: recommendation

    Viualisierung

    Die Informationflut der man in sozialen Netzwerken und im Internet allgemein ausgesetzt ist, kann schnell unübersichtlich werden. Gute Visualisierungen können dem entgegenwirken und bei der Analyse sozialer Netzwerke helfen. Dieses Thema soll einige solcher Visualisierungsmethoden zusammentragen.

    Bibsonomy-Tags: visualization

    Spam

    Wie erkenne ich Spam in sozialen Netzwerken wie Twitter? Kann man Spammer ahnhand charakteristischer Eigenschaften identifizieren?

    Bibsonomy-Tags: spam

    Stimmungsanalyse

    Bibsonomy-Tags: sentiments

    Konversationmodelle

    Bibsonomy-Tags: modeling

    Ereignisentdeckung

    Bibsonomy-Tags: events

    Ereignisentdeckung: Erdbeben

    Bibsonomy-Tags: earthquake

    Analyse großer, sozialer Graphen

    Bibsonomy-Tags: graph analysis

    Graphensuche

    Bibsonomy-Tags: graph matching