Posts Tagged ‘ 豆瓣

豆瓣数据存疑

Update:
感谢 Ratooykjingleptoqwhiplus 等网友的提醒,之前提的两个问题都有了答案。:-)

1、豆瓣用户量突然飙升,是因为 QQ 空间的“豆瓣读书” app;

2、Wayback Machine 抓取网站的存档之后,不会立即显示,貌似要一年以上历史。

另外,我后来看了下,其实豆瓣的用户都有个数字编号,从用户的编号和注册时间就可以得出准确的数据(第一位用户的编号是 1000001,所以用户数等于用户编号减掉 100w,不考虑被封杀和自杀的情况)。

下面是完整的数据图形:

douban

可以看到,09 年 8 月开始的那一跳……。最高时,一个月新增了 900 多万,相当于它前 4 年总和的 2.5 倍多。

不过我们也看到,一年之后,已经开始恢复正常了。这大概是 QQ 空间输血能力的上限了吧。

最后,我随机测试了一些,QQ 空间给豆瓣输送的用户基本都是无效的,没有任何活动。

(Update 完)


今天统计了一下豆瓣的注册用户数。因为豆瓣有在首页显示相关数据的习惯,所以这个统计显得比较简单(假设数据是准确的)。

翻开 Wayback Machine,可以看到,豆瓣最早在首页显示用户量的记录是 06 年 11 月 2 日

以下即是我根据这上面的数据绘的图:

douban

很可惜,Wayback Machine 对豆瓣的最后一次存档是 09 年 6 月 30 日,之后就没有了。不知道是豆瓣的 robots.txt 禁止了抓取(看了一下,似乎没有),还是 Wayback Machine 自身的原因。

上图的数据看起来中规中矩,没什么奇特。不过,我们看它的总注册用户量,最后一条记录显示,当时豆瓣的用户数刚刚达到 350 万。那是 09 年 6 月末,那么,今天豆瓣标称的用户数是多少?—— 4713 万。

加上这条,图立马变形。

douban

05 年到 09 年,四年多,350万;

然后 2010 年,一年半,4713 万,13 倍。

虽然我没太关注,但似乎豆瓣近一年来没搞过什么大的营销推广;反倒是因为审查严格,很多用户自杀了帐号。13 倍的数据有点惊讶,不知道是不是我哪搞错了。

“SNS”和“微博”——理念相克,试图揉合可能适得其反

SNS 和 Microblog 都已不是新鲜话题了,但有一个势头,SNS 想整合微博、微博想整合 SNS,我认为这不是好主意,可能会适得其反。

 

SNS 是什么?是关系,是加好友。七大姑八大姨、同学发小、客户伙伴……总之,你认识的人都得加上。毕竟,亲戚朋友多总是好事。

Microblog 是什么?是获取信息的途径。用来关注那些可能并不认识,但他们说的话使你感兴趣,能给你带来信息、思考或知识的人。

于是,冲突产生了:

  • SNS 应该鼓励实名化,微博随便匿名;
  • SNS 双向确认好友关系,微博应该单向关注;
  • SNS 鼓励多加好友、只要是认识的人;微博推荐物以类聚,不介意事先是否认识;
  • ……

 

拿 Twitter 这个显而易见的例子,如果我的某个发小在上面,我可能不会 fo 他。原因很简单,经过多年的各自发展,也许我们感情仍然很好,但隔行如隔山,我们可能很难有共同话题了。他发的他们那个行业很有意思的段子,可能我会觉得索然无味。上推是为了看一些有意思、对口味的信息,所以我不 fo 他。

那么,另外一个例子——豆瓣。它的社区应该是 Facebook 型的还是 Twitter 型的?设想一下,因为你在豆瓣把你的姑姑姨姨们加为了好友,某天你想买本 IT 书籍的时候,豆瓣会向你推荐某某菜谱;某天你想欣赏科幻电影的时候,它向你推荐xx韩剧;……是何感触?所以豆瓣的社区也应该是 Twitter 型的(大概一两年前,豆瓣有一个改版,似乎没经受住 Facebook 的诱惑,在原有的“关注”基础上,又增加了个加好友的功能。当时我相当讨厌,就离它远了点,后来的某个时刻,发现这个功能又被砍掉了,幸甚!)。

 

总结起来,凡是你想从所关注的人中获取有效信息的,或者系统根据所关注的人,通过算法自动向用户推荐有价值信息的,都应该是微博型的社区。而 SNS 适合生活化的东西,我觉得。

 

后记:刚发过一条推:

前几年,我订阅了很多互联网大佬的博客,带着崇敬的心情探头阅读这个行业。最近,我了解了一下大佬们的动向,发现他们主导的产品都关门鸟~。互联网跟体育一样,评论员当不好运动员。我还当不了评论员,努力成为一名运动员ing,嗯~!
http://twitter.com/wcm/status/8904614644551680

唔,敲自己脑袋,不要评论,要运动! @_@

对 GReader 之 "Share with note" 的评论,存个档

May 6

很好,很强大。。。抢 del.icio.us 的饭碗?
对用户来说,貌似很有诱惑。以前分享文章分两类,有 feed 的用 GReader,没 feed 的用 del.icio.us。这次整合,感觉不突兀,很自然。
其实受影响的站很多,比如最近豆瓣在大搞推荐跟分享。

当然,各个站的定位不一样。
del.icio.us 对于我来说,就是一个不设防的私人收藏夹。很多文章,并没有什么意义,甚至只是垃圾一篇。但考虑到某种原因(比如为了证明世上还有这么无耻的文章…)以后可能会用到,遂收藏之。
GReader 的 Share 就不能这么用。用 Reader 的目的就是为了阅读有价值的知识和资讯。Share 的原因必定是觉得写得不错,也许对别人有用。
豆瓣属于第三种了。它以社区见长,推荐的动机是为了交流,有强烈的意愿希望获得反馈。这就限制了它话题的广度和深度。有人分析过 digg 类网站趋同、趋俗的现象。
豆瓣有一点不同的是,它希望通过其它模块产生的用户行为分析结果,帮助用户从茫茫的信息海洋中过滤出适量的、符合个性化需求的信息。一个很好的想法。倒是建议豆瓣把“推荐”更名为“分享”,推荐是个很有心理压力的词儿,既然要向用户提供更精准的个性化信息,其源头自然要在广度和深度上尽量延伸。只是这需要足够强大的算法支持。

Feed 分享增加了评论跟 tag,相当棒。现在,针对一个热门文章,可以看到许多朋友伸出脑袋插话的现象了~。只是,,,Google 要托管所有评论么?想想有点邪恶了。。。虽然在 GReader 上的评论与在原文下的评论语境不同,但某些针对性不强的评论势必会产生困惑。在 Reader 上评论?在原文下评论?还是这边说完了再复制到另一边?豆瓣的“我说”就让我有点 confused(相对 twitter)。或许 Google 可以开放一个 api,使各个网站可以获取其任意页面在 Reader 上的评论(也许已经有了,没了解过)。其实,这样会更邪恶……。

最后BS一下,为什么不把 Google Notebook 上的数据搬过来,Notebook 现在显得重复了。

May 11, 0:57

Wiki 的提法有意思。
可以在原文的基础上改,然后这里就当是修改说明吧。
对同一主题不同人的修改加上相同的 tag 就类似版本记录了。

只是:
一、很多 blog 不是 cc-sa,这样做应该是不被允许的。
二、应该加强与 Blog 的整合能力。比如修改后的文章可以选择自动发布到自己的 blog;可以显示所有 Reader 用户对同一内容的评论,而不仅仅是好友(当然,有的人的评论不想被外人看,隐私设定);应该提供 api 使各网站可以查询并显示其文章在 Reader 上的评论(估计很难,相当于其它网站都在对 Google DDoS…Google云…据说很强,受得了么?做成了就NB了)。

May 11, 2:04

原来,阅读文章的时候,并不会自动显示好友的评论。

看起来,每一次评论都是包括全文内容的再发布,跟原 feed 似乎没什么关联。

这样来说,对于 Copyright 的文章,是不能 “Share with note” 的(即使未做任何修改)。或许删除原文只留一个链接,抑或留几个引用语句是可以的。

凑凑 SNS 的热闹--论facebook的必然没落

天天看到有人在捧 facebook。
本来想在 Twitter 上写两句话的,没想到越写越多,干脆总结下吧~

SNS 只是工具,而不是目的。我不认为有必要将现实关系再在网上映射一遍(当然,更不需要重建一套)。据此,我认为 facebook 必将雨打风吹去

有人可能会从研究的角度说,“啊,facebook 的架构如何如何好,拥有无限可能”……“啊,开放 API,8000个应用”……“啊,以用户为中心,以关系为纽带,用户黏性极高”…………。

我只想问一个问题:facebook 要的,就是让用户一个一个地添加好友,加满几百上千个,然后蹲在上面看人家在干什么?

至于那上面有的功能,哪个是独一无二,除此一家,别无实现的?
互动?我有什么话不能在 BLOG (Twitter) 上说?这才是高效和严谨的方式。我很难想象连我 BLOG 都不看的人,为什么要在 facebook 上盯着我看。
集成?呵,这又是一次个人门户的努力么?大部分人常上的站不超过10个吧?这区区几个站为什么不能加到书签里,爱上哪个上哪个。我放着好好的 Blogger 不用,为什么要上你 facebook 写 blog?我放着好好的 Google Reader 不用,为什么要用半撇子的 facebook api?我又为什么给 flickr 上传照片时要绕道 facebook?至于所谓几千个应用,只是各个网站来打广告和 killing users’ time 的。

当然,那些互联网观察/实践“家”们,他们喝彩并不是因为 facebook 多么有用,而是这背后巨大的利益令他们欢欣鼓舞、跃跃欲试。试想,关系是人类社会的基本要素,而网络化是必然的趋势。按照他们的理解,facebook 将来就是整个(或者大部分)人类的神经中枢,它是一个超级巨无霸。功能的巨无霸,一站集成你所有需要的网络功能;个人信息的巨无霸,拥有无数结构化、量化的个人信息,以及你自己都没意识到的种种心理、怪癖、嗜好……。
后面还用说吗?想干什么都可以!

然而,这正是我不喜欢 facebook 的原因。
倘若我进行互联网创业,首先问自己的是:这个东西对用户意味着什么?而不是:能搞到多少用户、多大的访问量、有什么商业模式。
如果我利用用户的无聊,通过浪费用户的时间,搞到了大量的访问量(甚至商业的成功),我会觉得这是在犯罪。

Yahoo 和 Google 是两个符合我的哲学的典型例子。前者在互联网信息荒漠的时代给用户以大量信息,后者在信息泛滥的时候帮助寻找方向。
很多人说 facebook 将是第三个 Big Thing,我觉得它担不起这个重任,facebook 的远景是类似 QQ 的 evil 存在。别提什么开放API,有些东西是不会给你的。

关系在交互中自然形成,Web2.0 绝不是 SNS 元年。
松散的个人信息不需要商业公司的统一管理,自由的互联网不需要 facebook;
需要的,是观念的进一步创新,以合理的技术连接每一个松散的节点,SNS 在其中自然形成。

WordPress + OpenID + BlogRoll 就是一个有益的尝试。
试想,每个人都是一个独立的节点,这里不存在中心。
没有人可以对用户说,“嘿,朋友,我知道,你缺乏性伴侣却又对此充满热情。我给你推荐一个XX牌的XX女郎!”……。
也没有公司可以携用户数据以令互联网,以此阻止竞争、扼杀创新。

退一步说,我也觉得豆瓣比 facebook 有意义。诚然,对圈钱者来说豆瓣没有 facebook 令他们心潮澎湃,但它有其存在的意义和核心价值。
当某个书评令我强烈认同的时候,当某人推荐的书影音竟如此契合我的胃口的时候,我可能默默地记住了这个人,加为好友。SNS 就这样自然地发生了,它以某个应用始,并服务之。

好像可以结尾了?呵呵,不过是一点点想法,没料到居然写了这么多花了这么久。
这也正是BLOG严谨的地方(相对而言)。不管你有多少读者,甚至只有你自己会看,只要发表出来,就必须尽量组织好自己的思路、语言以及格式,这是基本的素养。
读者看到的起码是认真思考过的东西,而不像呆在 facebook 偷窥狂似的事无巨细地盯着人家。
当然,facebook 肯定不会迅速关门,毕竟太多的人有太多的时间需要kill,Who knows。