Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
《社交网站的数据挖掘与分析》每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
通过本书,你将:
获得对社交网络世界的直观认识
应用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据
学习如何应用便捷的Python工具来交叉分析你所收集的数据
通过XFN探讨基于微格式的社交联系
应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术
通过基于HTML 5和JavaScript工具包的网络技术建立交互式可视化
目录:
前言
第1章 绪论:Twitter 数据的处理
第2章 微格式:语义标记和常识碰撞
第3章 邮箱:虽然老套却很好用
第4章 Twitter :朋友、关注者和Setwise 操作
第5章 Twitter:tweet ,所有的tweet ,只有tweet
第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类
第7章 Google Buzz:TF-IDF 、余弦相似性和搭配194
第8章 博客及其他:自然语言处理(等)
第9章 Facebook :一体化的奇迹
第10章 语义网:简短的讨论
下载体验