海外用户观看视频的正确姿势

刚才看到友人前几天写的一篇博文:海外用户观看美剧的正确姿势,突然就想哈哈大笑。原来大家都在想一样的事情。

先借一张图来说一下这个思路:在东亚找一台云主机下载,然后上传到GoogleDrive,当然也可以是OneDrive或者AzureStorage, whatever。然后在家里通过GoogleDrive/OneDrive同步,或者链接到AzureStorage访问。
downloadx800_jpg_pagespeed_ce_OUNfE-4oh7

友人在瑞士,据说当地法律并不限制个人用户下载盗版内容,所以这个解决方案没什么问题;可是放到其他大多数资本主义国家可能就不太行了。因为上述操作实际上仍然涉嫌通过云存储上传/下载盗版内容。当然上传的行为发生在东亚某地,所以可能没有法律限制,但是下载行为却真实发生在腐朽的资本主义境内。

而我最近考虑的另一个类似思路是:在东亚某主机上把下载的内容文件分割成很多碎片,每个碎片都是一段没实际意义的比特流,然后再把各个碎片分布上传到不同的网络存储上。这样不存在从任何地方上传或者下载盗版内容的操作,因为上传和下载的都只是一段比特流而已。只有自己知道具体的算法来分割和组合这些碎片。只有这个算法本身是属于盗版的,不过获得这个算法的过程发生于东亚的某台云主机上。
其实跟p2p软件的思路很像:p2p软件的每段比特流下载都不是完整意义的盗版。可是p2p在传播比特流的同时传播了组合比特流的算法,所以是非法的。
有版权方面的专家提供点专业意见么

ThinkPad X1的可怕体验

从06年买第一台笔记本开始,就逐渐成为了笔记本的重度用户,家里一直都没有台式机了。在移动终端日渐发达的今天,如果在家大多数时候仍然习惯选择使用笔记本。

我本来也不是数码产品的重度粉丝,没什么好说的。无奈前两周从公司领了一台X1 Carbon Gen2回来,在度过了不适应到两周之后就突然挂掉了,要换主板至今还在等零件——顿时对ThinkPad失望到极点。

X1之前先是用了很久的X220 Tablet,除了觉得Tablet这个特性基本无用之外,还是非常喜欢的。传统的ThinkPad键盘,传统的小红点和鼠标左右键都特别顺手;质量也没的说,特别皮实耐用。然后自家买了一台X230来用,性能质量也都没有问题,可惜键盘换成了巧克力式的,手感略差。这台230是机械硬盘,用起来一度觉得很崩溃,直到有一天换了SSD之后才发现它也可以如此流畅。

然后就是X1了,拿到手的第一天就很崩溃:

  • 小红点手感变差。看上去很劣质的样子,似乎随便摇几下就会掉下来。机械式的左右键取消了,变成一块儿更大面积的触控板——我原来就是直接把触控板禁用的。
  • 大小写切换键CapsLock不见了,那个位置被两个个头很小的Home/End取代。想要输入大写字母有两个方法:按Shift+字母组合——我知道有人很习惯这个,可是我一点也不喜欢;或者快速双击Shift键,这时候Shift键上会有一个小LED灯亮起,表示切换到大写——凭什么要我双击。
  • 跟随而来的另一个不便就是Home/End被挪到了CapsLock到位置,我写code的时候经常用的两个键就这样突然从右手位变到了左手位,还缩小了很多。于是错误的情况经常发生。
  • 最上面一排功能键F1-F12连物理键都没有了,变成了一排触控点,而且可以切换,一会儿是控制音量亮度,一会儿是打开麦克风,一会儿又变回了F1-F12——尼玛我debug的时候一不小心屏幕就暗得看不见了,这是什么体验。
  • 数字1左边的~键被挪到了右下角,那个位置成了Esc。。。其实不是什么大事儿,可是我天天要输好多遍的password里边偏偏有个~,在一天输错了数次密码之后,我只好选择改密码。

说来说去发现其实就是在吐槽键盘。对大多数笔记本来说,性能都不是大事儿:差异无非是键盘体验,重量,续航,屏幕。Intel推出超极本之后重量不是大事儿,而windows笔记本的续航都不怎么样;至于屏幕嘛,那就继续吐槽一下这个高分屏体验吧。
确切的说这不是X1的错,所有的windows笔记本上高分屏体验都很烂。我一直不太在意屏幕,1366×900也照样用得不亦乐乎,直到拿到X1看到所有的图标都变得咪咪小,才恍然大悟原来这就是高分屏啊。像小白一样去百度知道学习如何放大显示。尽管放大之后系统本身和微软的主流程序都可以基本正常使用了,但是仍然有那么些想死的时候:

  • 比如远程到另一台电脑之后,远程桌面上的图标忽然变得咪咪小,不能放大。
  • 比如截屏之后粘到outlook的邮件里,我擦怎么突然图片变得巨大而模糊来——我猜可能是outlook放大显示的问题,可是我真的不知道别人收到邮件以后会看到什么样的图片。
  • 比如打开某些非微软多程序的时候,要么死活不能放大,要么放大完丑得不想再看到它。这其实也不完全是微软的错,为了兼容各种原来的应用,高分屏没办法做到完美体验。可是我是用户,我干嘛要理解微软的苦衷呢。用了Retina的MacBook Pro,才知道什么是完美的屏幕,舒服的让人不能自拔。
  • 最后不得不提一下品质。其实我是不太相信品质这个词的,大家的笔记本都是一样的流水线下来的东西,能有多大差别的,我当年买过低端的明基本,戴尔本,东芝本,都用得好好的没出过任何状况。可惜这台X1从一开始就觉得不太好,系统稍微忙一点风扇就开始疯了一样的响;有时候已经sleep了还会莫名其妙的风扇狂转;用了两周之后就彻底崩溃进不了系统了,IT也没告诉我具体原因,只说要换主板了。这次我终于相信品质是有差别的,或许X1 Gen2的设计,尤其是散热方面是有缺陷的。

    既然提到了MacBook Pro,就顺便比较一下:重量虽然比Air重很多,但是男士用起来完全没有问题,仍然觉得很便携;续航没有10小时也有7,8小时,没有具体计算过但是很少为没电发愁,可以专心使用一整天是件很开心的事儿;屏幕如上所述;键盘手感略差,不如巧克力式的ThinkPad键盘,感觉主要是键程短,更不如X220之前点传统ThinkPad键盘。至于苹果的系统,比windows难用很多;好在现在的应用大都是基于web的,不太关os的事情。

    吐槽完毕。总而言之,怀念当年ThinkPad带来的美好体验,终于被Lenovo折腾得差不多了。所谓对创新就是三天两头把键盘的样式布局变一变,而且越变越差,把这些最经典多东西统统变没了。如果不是工作原因,我已经基本不需要使用windows了,Mac本上有非常好的体验。如果说windows笔记本还有什么希望的话,我觉得已经不在ThinkPad而在surface了。在商店里数次把玩surface都感觉不错,完美对移动办公选择。希望surface 4会进一步改进,到时候入手一台继续比较。至于ThinkPad,就把这些年来的美好体验当作对经典的记忆吧。

新玩具

好久不见。
发个最近搞的新玩具出来:树莓派Raspberry Pi. 一个ARM架构的小主机,只有名片盒大小。我买的这一款是model B,900Mhz A7架构的cpu, 1G的内存,有4个USB接口,hdmi接口。。。售价35美元。最近刚刚出了model B+型,配置更好价格不变https://www.raspberrypi.org/products/raspberry-pi-2-model-b/

树莓派最初是设计来作为廉价电脑给小朋友们学习用的,后来逐渐在geek中流行;最近很火的IoT概念更是让树莓派出现在各种奇奇怪怪有意思的场景中。它可以很容易的跑linux,有专门为它定制的Raspbian发行版--听名字就猜得到是基于debian的。

于是,最容易想到的应用就是拿它做一个高清播放主机,播放在线视频或者做bt下载播放机都不在话下。只有名片盒大小放在客厅很合适。除此以外还有更多好玩的应用,比如见到过有人拿kindle作为ssh的客户端,远程到树莓派的主机上,这样就可以实现在户外一边野营一遍写code了,配上太阳能电池或者移动电源在荒郊野外用上几天不成问题。还有更多的人用它来控制其他设备,做IoT。比起单片机来说它功能强大很多,可以做更多的事情;而且基于linux系统,可以轻松的用python,java这样的高级语言来代替汇编或是c,开发速度快很多。还有人拿很多很多个树莓派来搭集群,虽然性能肯定一般,但是能花几百美元就体验一下搭集群的感觉看来也不错哦。

我也没有想好可以用它来干嘛,就扔在那里跑个linux的小服务器需要的时候ssh连一下也挺好的。

WP_20150131_003

WP_20150413_001

回顾2014

昨天,赶在2014年结束之前去snoqualmie summit滑了一次雪;而去年恰好也是同一个时间,我们正在长白山滑雪,两次滑雪之间正好是一个完整的2014。

从来没有这样忙碌曲折的度过一年,没有像现在这样不知道未来会怎么样,更没有像现在这样有一种“生活正在不可避免的走向庸俗”的感觉。从前都是抱着看风景的心在生活,年底的回顾总是想想自己走过了哪些地方还想去哪些地方。这大概是从王德峰那里听到终极关怀这个词以后这些年来一直坚持的:作为一个终将逝去的生命,最大的意义莫过于尽可能多的收获各种经历,获得多样的人生体验;而旅行就是重要的方式。所以每一年都会心怀美好,微笑前行。这会儿忽然发现今年的总结不能这样写下去了,除了旅行不得不提那些结婚出国买房换工作的所谓人生大事–它们都发生在2014。

1月,去长白山滑雪,换工作,回家过年。
其实换工作的事情从2013年末就开始准备了,但是一直没有特别多的进展。元旦的时候郁郁寡欢,就去长白山滑雪换一下心情–感谢这个明智的决定。度假回来之后就整个月都在为换工作忙碌,连续几周为了面试早上六七点爬起来抱着电暖气打电话,然后忐忑的等消息,在失望和希望间徘徊。

2月,继续工作面试,在西安过年。
连大年三十初一还在打电话面试。然后就是春节在西安过,也没有去哪里玩儿。来回上海的时候体验了动车郑州换高铁的生活,但愿再过两年可以直接高铁来回。

3月,婚礼,买房,准备签证材料
1号去三亚,2号在亚龙湾沙滩上婚礼,之后在三亚度了个小假期然后爸妈们和灰灰分别飞西安成都,我飞回上海。月底买好房子,我们也是很神奇的人,只看过一个楼盘就买了,到最后还糊里糊涂的,觉得真的是买了吗。。。另外这个月还在到处跑准备签证材料,去了张江校区,还回了两趟复旦,在本部食堂又吃了一顿饭。

4月,签证,办贷款,安吉江南天池德清莫干山小旅行,回西安
去梅龙镇签证,小长假开车去江南天池莫干山小旅行,吃了可口的农家菜,还挖到了惊雷笋,短暂的回了趟西安还被办贷款的事儿打断了。然后就是各种跟朋友们的告别聚会。

5月,离职,来雷德蒙德工作,奥林匹克国家公园小旅行
9号飞到雷德蒙德12号开始上班,趁着小长假去奥林匹克国家公园小旅行,然后就是办各种刚到米国需要的证件手续。

6月,买车,租房,买家具布置新家,考驾照
买好了车,接灰灰来米国,搬到租好的公寓,接下来就是买家具,组装各种家具,买各种家用,还在fail了一次以后拿到了米国驾照。

7月,西雅图周边爬山,雷尼尔雪山徒步,工作变动,进ER
安顿好了家里开始趁着西雅图最好的夏天到处爬山郊游,最有意思的应该是雷尼尔雪山徒步了,一路风光无限。可惜徒步回来第三天就生病了,突然头晕目眩打了911去了ER(急诊),在ER待了几个小时就被医生告知是眩晕症打发回家了,一起回来的还有天价账单。7月17号公司突然宣布裁员,随之而来的是部门工作变动,1个月之内被各种re-org,换了4个老板。似乎工作再也不像从前在上海那样了。

8月,西雅图周边爬山,奥林匹克徒步
继续在西雅图周边爬山郊游,因为眩晕症进ER的事情郊游的节奏慢了一些,奥林匹克徒步算是比较heavy的一次了。

9月,夏威夷度假,去Levenworth看秋景,工作变动
8月底到9月初的夏威夷度假算是今年唯一的大旅行了,真是不容易。出发之前也是很纠结,纠结地点纠结机票住宿的价格,坦白的说觉得在米国旅行价格还是相当不菲的,但是却比国内的旅行少了很多乐趣。但是所幸最后还是坚定的出发了,夏威夷真的是非常美的地方,景色的丰富程度也绝非一个普通的小海岛可以概括的。另外在叶子逐渐黄起来的时候去Leavenworth看了秋景。公司继续裁员,所属的部门这次影响不大,但是原来上海的部门却天翻地覆;知道消息之后的一两个星期心情都不能平复,并非庆幸自己没有被裁,反倒觉得应该在自己被裁掉之前想想以后到底要怎么办。

10月,去Yakima看秋景,看三文鱼洄游
似乎只去了一趟Yakima看秋景,然后就是看了华盛顿州有特色的三文鱼洄游。

11月,宅
当西雅图雨季到来以后,生活就一下变得乏味了许多,绝大部分时间都只能宅在家里。当夏令时变到冬令时之后,天更是黑得令人发指的早。从此以后,似乎天天都是阴雨蒙蒙暗无天日的感觉了。所幸待在家里还是可以看电视剧看电影看书打发之间的,另外还做做健身操,甚至连写blog都比以前频繁了。

12月,生病,去滑雪
从11月末感恩节之前就开始生病了,因为米国看病效率低下得可怕,外加可能是药物副作用,被这场病前前后后折磨了一个多月,最后以看了数次医生,做了几个检查,进了第二次ER,收到了更加巨额的账单收场。中间最绝望的几天,只一心想离开这个鬼地方;逐渐好起来以后,更加坚定了要坚决和直截了当地生活的想法。昨天去滑了次雪,很开心很畅快。

写完了,怎么看都不想是一场关于去了哪里还要去哪里的旅行回顾。这一年发生的事情实在太多,简单而无忧虑的工作+旅行的生活方式似乎不适用了。就连之前信誓旦旦的说我要走过更多的地方的心愿,都没有那么强烈了。这并非开始否定自己对于生命的看法;只是开始思考,对于一个年过30生活正在不可避免走向庸俗的人来说,仅靠每年数次蜻蜓点水的旅行和几张绚丽的风景照来肯定自己存在的意义,真的足够了吗?

关于2015,最美好和最忧愁的事情都是:不知道该怎么办,该往哪里走,会发生什么。我想我会继续旅行的脚步不停歇,同时给自己找更多有意义的事情来做,除了在路上的那些精彩瞬间,剩下的三百多天同样应该精彩。走吧,勇敢地滑下,用力地摔倒。

来看看12306泄露的用户数据

昨天来自乌云网的一条关于12306用户数据泄露的消息被到处转载,迅速传播。据说大量用户登录导致12306第一次并非因为抢票而瘫痪。跟很多人一样,我因为懒惰和记忆力差,所以喜欢在各各网站用同样的密码。这样做最大的危险是,一旦某一个网站因为安全漏洞泄露了密码,那么拿到密码的人可以用同样的密码去猜你在其它网站的密码,一猜一个准。所以像昨天这样的事件发生以后,登录12306改密码其实是无济于事的,你得把所有跟12306用了同样密码的地方全改掉—-要一下子想起所有注册过的网站,好难啊。

所幸后来又有消息说,昨天只泄露了很小一部分的密码,不到14W。12306网站声明称,密码并不是从12306内部数据库泄露出来的。从泄露密码的数量来推测,我是比较相信这一说法的,如果是12306数据库泄露出来,那么就远不止这个数目了。我们就姑且相信12306真的没有用明文存密码吧……如果泄露不是来自于12306,那最可能的途径就是大家抢票用的各种抢票软件了。用过的人都知道,抢票的时候要把各种信息都输入在抢票软件里边的。抢票软件花样繁多,来路繁多,万一用了恶意的或者愚蠢的抢票软件,那密码被偷去是易如反掌的事情了。

我每年抢票的时候也都用了一些猎豹,360之类的抢票软件。所以赶快去搞了一份泄露的用户数据来看看自己有没有中招–所幸没有。庆幸之余,也正好看看这份包含13w+用户数据的文件,分享一些有意思的东西。

首先说明一下,根据我看到的这份数据,我怀疑数据的来源是有一定倾向性的。换句话说,这份数据可能代表了某一类人群,放大到所有互联网用户上可能并不准确。

1. 密码的长度
大家都知道密码越长越安全,因为如果黑客用计算机破解密码的话,越长的密码需要花越多的时间。当然越长的密码也越容易忘记—-所以很多人像我一样,都喜欢偷懒不用太长的密码。
从这13w+个数据中可以看出,绝大多数人的密码在6到10个字符之间,用8个字符的是最多的。所以为了增加你密码的安全性,建议使用11个或12个字符的密码,这样你已经比绝大多数人的密码都复杂了,而且也不用花太多精力,只需要多记忆一两个字符。
PWD_Length

2. 密码的复杂程度
通常来说,混合了数字,字母和特殊字符的密码比较安全。大多数人喜欢用字母和数字作为组合,用特殊字符的人就很少了。这份数据里边只有1%的人在密码里使用了特殊字符,其他的都只包含数字和字母。
所以如果你想自己的密码比大多数人更安全一些,另一个选项就是使用特殊字符,随便在密码中间嵌入一个特殊字符就安全很多了。
PS:刚刚经人提醒,12306网站上居然只允许用字母,数字,下划线做密码,真是狗日的啊
SimplePWD

退一步来说,我们把大写字母也当做一种特殊字符,来看看多少人的密码里仅仅使用了数字和小写字母—-98%。如果你的字母里用了大写字母,恭喜你,你已经属于仅有的2%了。
SimplePWD2

除此之外,这些密码里边常见的模式还有:
姓名缩写和生日的各种组合
手机号码的某些位
qq+几位数字(这种一看就知道也是qq密码,我就不去试了)
123456abc
键盘上的一些位置比如123zxc

看完了密码,我们再来看看用户的情况。

3. 注册邮箱
关于注册邮箱使用的分布我觉得特别有意思:用qq和163邮箱注册的用户占了这13w+人的绝大多数。而我以为非常流行的Gamil, Hotmail和Yahoo邮箱分别都只有一千多。我个人作为gmail和Hotmail用户,在这里边属于绝对的少数派了。关于这一点我有两种猜测:

  1. qq和163邮箱用户确实占了中国互联网用户的绝大多数。首先qq用户群是无与伦比的主流,而每个qq用户只要知道自己的qq号(废话)就自然记住了邮箱,比起要去单独注册一个邮箱容易的多;而网易邮箱只少在当年Gmail出来之前也是非常有人气的。看来用Gmai和Hotmail的所谓互联网从业人员们,已经离主流太远,太不接地气了
  2. 还有一种可能是,密码被泄露的这些人大多时候qq和163用户。比如qq和163的用户更可能用到某公司的抢票软件?

EmailServer

4. 年龄分布
从用户的年龄来看,绝大多数是80后,90年代初和70年代末的人群次之。这个应该比较好理解,需要抢火车票的更多是正在社会上挣扎的80后们。年纪再大点的人已经有老有小,生活相对稳定,不再需要太多漂泊;而90后尤其是95后基本上还在家和学校。
Age

另一个有意思的是,还看到一些早到1920年,晚到2014年的身份证号。对1920年这样的身份证号,我猜测可能是某些人用家里老人的号码注册了买票,2014年的身份证号就不明白了,难道不是16岁才有身份证号吗?

5. 性别分布
泄露数据的用户93%是男性,女性只占7%。我不太相信中国抢购车票的男女比例是93:7 —- 如果这样的话说明有很多男性在帮女的抢车票:) 更可能的原因是男性用户占到了抢票软件使用者的绝大多数,因此中招的也更多。作为抢票软件的作者们,你们应该反思一下为什么自己做的软件那么复杂,女性用户都不能使用了:)
Gender

6. 星座分布
除此之外,还想看另外一些好玩的数据,比如他们的地域分布,星座分布。地域分布根据身份证号逐个确定省市有点麻烦懒得弄了;这里姑且看一个简单版的星座分布(只看月份,不看二十三四号切)。
我相信这接近于中国年轻人在各星座上数量的比例,而不太相信某个星座在抢火车票这件事情上会有某种特别的行为。
constellation

冬至吃饺子

离家的人反而格外尊重传统,总是记得每一个特别的日子。今天按照北京时间算是冬至,即使离家万里也要吃饺子。
西安人喜欢吃的是酸汤水饺。只是今年的酸汤水饺既没有红油辣子也没有陈醋。。。生病了就只能吃这样寡淡的酸汤水饺了,幸好香菜葱花和虾皮还是有的,饺子也是现包的。想起大学时候每年冬至都会跟寝室的兄弟一起四处找水饺吃,找来找去只能吃到蘸醋汁的水饺,现在已经很幸福了。
老爸发微信说要吃饺子,冬至大如年。祝所有的人冬至快乐。
WP_20141221_001

说说在米国的生活费

前一阵读到一本有趣的书《银元时代生活史》,作者很详细的讲了清末民初上海滩各种生活花销的状况,比如坐个电车去租借多少钱,吃一个猪排饭的西餐多少钱,坐黄包车又要多少钱,读起来很有意思。既然飘在美利坚,那么我也记录一下这里的花销,或许若干年以后读起来也会觉得有趣。

我们在西雅图周边一个叫雷德蒙德的小城租住的一室户的公寓(apartment),每月租金大约1350刀。房间大约有80平,算是宽敞;其实两室,三室的公寓租金也不会相差太多,大约1400-1700。跟房价相比,租金算是相当的贵了;而且米国人似乎很喜欢坑老用户,各种优惠都只给新用户;租房的时候就是房租年年到期就涨,没有优惠,明摆着逼你要么接受涨房租,要么折腾着搬家。另外,这里租房都是没有家具的,各种家具需要自己购置,搬家的时候搬一大堆的家具也是件很痛苦的事。

接下来就是水电网费花销。
华盛顿州并不缺水,但是不知道为什么水费特别贵,每月水费和垃圾费一起大约70-90不等。
米国能源价格都比较便宜,电费也是实行阶梯电价,其中第一阶梯每月大概是600度电,每度1毛左右;这个价格跟国内的电费价格大体相当。但是用电的地方比较多,洗澡做饭都是电的,冬天的暖气也是用电,而且这里的冬天又特别漫长。前几个月夏天的时候我们家电费大约不到40刀每月,冬天估计要100多了。
宽带25m的同轴电缆网络,40刀每个月还是新用户的优惠价,一年以后据说会涨到60多。米国的宽带网络方面算是落后的,由于缺乏竞争至今仍然以同轴电缆,ADSL网络为主;光纤网络价格大多要80-100刀以上,并不算普及。
两部手机都是ATT的网络,之前用预付费的套餐每个月40刀每部,电话短信不限,但是流量只有300M。后来加入了别人的家庭套餐每个月30多刀每部,电话短信不限,流量大约有2G。其实我觉得米国的电信费用真的一点都不便宜,不直到为什么网上会有很多谣传。

车的花销。
车贷180刀每月,保险费130刀每月。油费似乎夏天比较多,因为周末经常出去爬山到处逛;冬天宅在家里就很少了。算60刀每月吧。所以保险费真的很高……

吃饭。
一般每周去超市采购一次一周的吃的,一个月大约500刀不到吧。肉的价格跟国内比不算贵,猪肉鸡肉便宜一些,牛肉羊肉略贵也就6-8刀一磅的样子;蔬菜种类比较少,跟肉价格的差距明显比国内小,按照同样重量的蔬菜和肉提供的能量来计算,在这里吃肉更划算一些。最郁闷的是很多我喜欢的蔬菜都很难买到,或者品质很差,或者很贵,比如蒜薹,韭薹,春笋,香椿,平菇。。。牛奶好像很便宜,一大盒2L的也就三刀多;鸡蛋一打12个的貌似是2刀多。当然这些都是非organic食品的价格,如果全都要换成有机食品,那价格应该要翻倍吧。
在外面吃饭的次数比在国内明显减少,主要是觉得在外面吃花了不少钱还都特别难吃,一个月大约100多刀不到200吧。原谅我太苛刻,但是这里餐馆的中餐水平实在太普通了,连大学周围的小店都能甩开它们几条街。除了中餐,也去吃过日料,但是明显不如上海高大上的自助日料令人开心;吃过韩国料理,只能说味道还凑合,恐怕是不如釜山,汉拿山的。当然这里的餐馆也并非一无是处,我最喜欢的竟然是越南pho,就跟兰州牛肉拉面一样令人欣喜,价格便宜量又组;泰国菜味道也都不错。

除此之外还会偶尔买一些家用小东西,所以每个月的基本花销大约在2800-3000刀的样子,包括最基本的食住行,不包括各种购物,娱乐,看病,旅游支出。。。

该不该有推荐系统

现在网上的很多应用都有个性化的服务,比如在豆瓣你可以听私人电台,在亚马逊购物你会收到一堆邮件推荐你可能会感兴趣的商品,或者你在google搜索一个关键词,得到的结果和另一个人搜出来是不完全一样的。

各家的系统实现可能千差万别,但是最基本的出发点大致相同:通过各种方式猜测用户喜欢的,然后投其所好。所谓物以类聚,人以群分,要知道用户所好,基本上会通过两种思路:知道这个用户是哪一类人;知道某个物品是哪一类物品。实际上系统的策略可能综合两者。

举个栗子,你在豆瓣上给月亮之上和最炫民族风加了红心之后,豆瓣就会挑个小苹果放给你听。它发现你喜欢月亮之上和最炫民族风之后,把你分到了广场舞爱好者这一类用户里边,而广场舞爱好者同样喜欢小苹果,所以就推荐给你了。然后豆瓣又放了荷塘月色给你,因为荷塘月色和月亮之上都是凤凰传奇的作品,联系紧密。

看似简单的想法有时候非常有效,比如用了推荐系统广告投放更精准,推销成功率更好。(当然实现这样的系统并非易事。)

推荐系统并非总是好的。它的出发点是基于相似,相关,因而用户用户从推荐系统得到的东西总是“某种关系更密切的东西”。听歌的时候可能总会被推荐某种特定风格的歌曲,买东西的时候总会被推荐自己或朋友经常关注的商品,甚至在搜索引擎搜东西的时候,排名靠前的都是自己熟悉/喜欢的内容。想象一下两种情景:
A. 每天打开豆瓣永远听到熟悉的歌曲;去买东西总是几个常见的品牌;搜出来的内容都是符合自己观点的;甚至连看到别人的评论都是被过滤过的
B. 打开电台不知道放什么歌,可能一点也不好听恨不得马上跳过,也可能让你眼前一亮—-原来世上还有这种歌曲;买东西不经意间看到一些奇奇怪怪的产品,可能毫无用处,也可能带来惊喜;搜东西的时候无意间发现了一些闻所未闻的内容;评论里好好坏坏都有,可能让你高兴也可能生气
你更喜欢哪一种方式呢?我会选择B。 有句话叫兼听则明,偏听则暗, 推荐系统在我看来恰恰是一个容易让人偏听的东西。生活之所以有趣,是因为有很多偶然事件然后接触到了以前未知的东西,推荐系统降低了人接触这些未知事物的概率。

前几周看到过一个Ted的视频:Beware online “filter bubbles”。实际上这个视频在讨论同样一个问题,一些在线系统自己为是的帮助用户过滤了一些东西(过滤是另一种形式的推荐),这样会影响用户对问题的看法,忽略一些本来有权利知道的东西。
从更高的层面来说,互联网的伟大在于它使得人们可以以前所未有的方式平等的交换信息—-这里不存在一些高高在上的人和组织可以控制,垄断信息的交换传播。可是推荐系统恰恰在用户之上控制了用户可以看到的东西,这是极其危险的。大家都依靠google来获取信息,而google却可以决定让你看到什么不看到什么。

要解决这个问题,至少在线系统应该提供一个选项给用户,让用户自己决定是否启用推荐系统。(其实更高级的feature应该是由用户自己设计自己的推荐/过滤系统)
最近发现google搜索结果页面的右上角有一个选择按钮,可以选择显示或隐藏private results,这样就不错。
不像某逊,一打开页面就超大图片显示我最近浏览过或者之前买过的商品,还不停的发邮件翻来覆去推荐一些商品。且不去说推荐算法多么SB,我买了个电饭锅就三天两头推荐各种电饭锅。。。尼玛我又不是贩电饭锅的。如果推荐这么没水准的话,就不要推荐了,让用户自己安静的逛逛看看有什么有趣的新东西也好。

来看下Azure用户的吐槽

今天,作为Azure的用户,私人邮箱收到一封来自Azure Service的邮件,对上周发生的Azure云计算平台大规模宕机事故做出解释和道歉(http://www.cnbeta.com/articles/347413.htm)。邮件中附带了一个CVP写的blog对整件事做了全面解释: http://azure.microsoft.com/blog/2014/11/19/update-on-azure-storage-service-interruption/

这次事故的影响比较大,波及了Azure 15个数据中心中的12个(Brazil, Australia, China)除外。受波及的数据中心也都比较惨烈,从虚拟机,到网站以及许多其他高级服务全部或者部分不能使用,甚至连用来给用户查看Azure健康状况的dashboard也不能正常工作。到现在总算才把事故的各种遗留问题逐渐清理完毕。

事故的原因很简单,存储服务为了提升性能做了fix,在几周的小规模测试没有问题后同时在各个数据中心部署了这次升级–结果这次升级改变了存储服务前端服务器的一项配置,然后触发了一个bug,服务器无法相应。惨的是出问题的是存储服务,几乎所有其他的服务都依赖于此,所以纷纷躺枪。

认真读了一下上面那篇blog,以及下面大量Azure客户的吐槽,感受颇深。这里列举一些印象深刻的。我相信现在各个企业的云服务或多或少都有类似的问题,这也是为什么很多人/公司对云抱着保守迟疑态度的原因。看到下面的抱怨,或许更能理解什么是客户所想,什么才是更好的服务。

  • Why would you then attempt the upgrade across data centres at the same time? A very important service of ours failed even though we have both north and west Europe deployments. We pay a premium for this and it is now shown to be wasted money.
    很多人问,为什么要在多个数据中心同时做升级?为了做到异地容灾,客户已经花了大价钱在多个数据中心同时部署服务了,可惜还是中招了。。。异地容灾一点作用都没有起到,纯粹浪费钱。
    —-还有人跳出来说,不对啊,15个数据中心不是还有3个好着吗,难道微软是要推荐我们在15个地方都部署么,想赚钱想疯了么
  • “Why was the dashboard marked all green for Azure West despite our TAM and TAs informing us that the issue was ongoing? We rely on the dashboard to know what the health of Azure is, it seems like its more of a PR stunt now.”
    “There was an Azure infrastructure issue that impacted our ability to provide timely updates via the Service Health Dashboard. As a mitigation, we leveraged Twitter and other social media forums.”

    为什么发生事故的时候dashboard还显示一切正常?很多人靠这个来看azure有没有出问题结果失灵了,还是到twitter上才看到的消息。
    —-因为dashboard服务也依赖于存储服务,当存储服务挂了的时候它也挂了。后来微软只好用twitter等渠道来公布消息。
  • “The platform & services are really ingenious and I still trust in this, but you’ll have to improve your behavior much more than a 100% instead of the performance of services.”
    有客户还是信任微软的服务的,但是。。。100%的可靠性比提升性能什么的可重要多了。(工程师式的思维必须要换一换)
  • “For comparison to this anemice blog here is Amazon’s response to a smaller outage they had.
    http://aws.amazon.com/message/…
    Its like a 8th grade English paper vs a doctorate thesis.”
    还有不少人觉得这篇blog写的太烂,amazon出一个局部事故的时候写的声明比这个专业多了。(有兴趣的可以读一下,是专业很多)
  • “During the outage yesterday it wasn’t even possible to kill a server, which means it wouldn’t even be possible to pack up our things and move to a different provider.”
    宕机的时候想把服务器kill掉切换到别家的服务器都不行。。。(只能干等着两三天以后恢复,简直生不如死啊)
  • It seems unless you pay them for a ‘subscription’, you cant report anything to anyone about something not working, because of a fault on MS/Azure side.
    I’m quite competent, and setup and run my own servers for many years, and I dont think I should have to ‘pay’ to let MS know about problems. I’ve talked to their support in ‘India’, and they seem to only have a very basic understanding of computing or anything, and really couldnt grasp what I’ve been trying to tell them about.
    I’m only running web small sites on Azure, but I would be a bit hesitant of running anything more, as it could just stop working, and then you have no one to talk to or help. 🙁 I feel helpless using Azure when there are problems.

    害怕用Azure,因为一旦它出问题的时候会发现自己很无助,不知道找谁寻求帮助。(我不太理解这个人说的pay them for a ‘subscription’是什么意思,莫非客户支持是额外收费的?)但是any way,根据我上次office 365服务出问题打客服电话的体验来看,确实是有很强的无助感。
  • “the fact that this blog was NOT posted on the Azure twitter account, and the complete lack of interaction with customers on the twitter is shameful. We understand that shit happens, but the human side of this could have been handled much better. How hard is it to get a staff person to sit on twitter and answer peoples questions, provide updates, or at least some sign of life. We were hit at a TERRIBLE time and lost huge amounts of traffic. I really like Azure but the total lack of support and communication here really makes me question why I am paying for this service.”
    “This is a press-conference level event, and you should have staffed PIO positions to keep us in the loop. On a side note – You might want to apologize on twitter, and fire your marketing team who started in on promo tweets without even sending out a link to this blog (at the time of this comment…).”

    这两段吐槽大约属于PR范畴了,事故发生的时候在twitter上发了个消息就没下文了,没有和客户的互动:回答问题,及时更新状况。(我也同意这样的事情应该由公司统一的PIO-新闻发布官出面,不知道Azure找了个什么人发的twitter。。。)人在无助的时候,哪个有个人陪着说说话感觉也会好一点吧,做service也是这样
  • “Actually the problem is down to centralization. There are plusses and minuses to that. When many elements in a system are dependent on one thing, it offers a lot of advantages in terms of shared resource, but puts that central thing on a very critical path. This is essentially why the central planning method of the soviet socialist era became too expensive to sustain. The original idea of the internet was decentralization. Instead the state-corporate machine has co-opted that into a centrally planned economy. Ironic really.”
    最后这个属于哲学探讨,有兴趣的话可以讨论下。互联网的核心和本质就是平等(去中心化),云计算确恰恰相反,它要把大量的资源集中在少数的数据中心。这样在带来低成本高资源利用率等好处的同时,也会使互联网变得脆弱,因为一点中心节点发生问题就全部瘫痪。(这个人有句话比较有意思:集中化不好的著名例子就是苏维埃社会主义的失败。。。)

再用linux

自从离开学校来到某软上班就基本没怎么用过linux了。

当年在学校寝室里,就凭着“计算机系的怎么可以用xp”的热情和理想,跟各种linux的发行版一起度过了许多不眠之夜。那个年代ubuntu还没有出现,听得最多的是redhat和fedora。现在家里可能还扔着fedora发行版的光盘,刚才随便search一下居然已经出到fedora20了,真是时光荏苒。尝试了redhat/fedora之后又继续试debian, 玩儿gentoo,觉得只有自己编译kernel才够cool。电脑被无数遍的重装重装,每次安装完又搞各种系统设置程序安装:显卡驱动,网卡驱动;中文字体,输入法,mp3播放器,视频播放器。。。大四那年找来一台奔三10G硬盘的破机器,装个linux居然用来当bbs服务器;再后来读研究生开始追ubuntu,四处分发ubuntu光盘,连实验室的服务器也被装成ubuntu跑crawler。。。

现在想起来,读书的时候真是个美好的年代。每天有大把大把的时间,又不用太多的考虑养家糊口,可以尽管折腾自己喜欢的事情。

刚去某软实习的时候对win的知识寥寥,第一次见别人用vista的时候还挺惊讶(外面真没见几个人用过vista…)。后来因为工作关系基本都切换到win了。如今又要用linux,再装ubuntu,版本号居然已经到14了。

简单的说,整个体验比较顺畅,似乎不太需要像许多年前那样折腾了。先去网上下载ubuntu光盘,然后根据文档用一个叫Universal USB Installer的工具把光盘写到移动硬盘里;接下来重启电脑从USB启动,进入ubuntu安装界面,根据引导点几下鼠标就OK了;中间有一部提示连接无线网络,显然无线网卡已经正确识别。

系统安装好以后稍微熟悉了一下Unity的UI,然后用firefox上网下载了chrome的安装包装chrome,双击就可以了(其实稍微用了下firefox觉得也不错,只是chrome的setting可以多机器同步)。再到搜狗下载了搜狗拼音输入法,也是双击安装。接下来,JAVA JDK, Eclipse, Ebook Reader, Sublime编辑器,Remote Desktop…似乎都很顺利,很少需要在terminal运行什么命令都可以轻松搞定。然后我的日常需要基本就满足了,除了不能用outlook收邮件,没有onedrive客户端。

我相信这样的用户体验,只要稍微有点热情的用户,都是很容易上手并且习惯上它的,不需要是什么计算机专业的学生。而且对早已习惯并厌倦了win的人来说,这样的界面和UI很容易给人眼前一亮的感觉。我读书那个年代的linux geek体验大概以后会越来越少了。

十来年的时间,到底是什么改变了这一切呢。当年我们一帮小伙伴认真讨论过microsoft这样的垄断公司到底怎么才可以被打败,基本都觉得是不可能的;但是现在,虽然win依然在PC领域占垄断地位,但是显然大多数人都同意离开win没什么大不了的了。

互联网行业在这些年之内的突飞猛进功不可没。十年前互联网还没这么发达,大家除了在网上浏览新闻下载资料之外,大部分的需求还是在PC端做的。
比如听音乐看视频,当年大家都是把mp3和各种格式的video下载到本地看。linux的生态系统远不如win完善,很多软件都不好用,这就给linux的用户造成了很大的负面影响,最后迫使很多人放弃linux。比如为了看视频,甚至要自己编译kmplayer;而且由于版权的原因,一个地方下载的播放器并不保护所有的解码模块,又不得不去四处去找;还有字幕,字体等等问题要一并解决—-就看个视频就得折腾这么多事情。如今更多的人可能都会选择在线听音乐看视频了,只要有浏览器就足够了。所以这次装好系统之后我几乎没有去在意能不能播mp3放视频的问题—-不过刚才打开了一个健身操的视频倒也是双击就可以播放。
再举个例子,以前很多人不得不用linux是因为没有office没法跟别人交换文档,现在则可以简单的通过office online完成office文档的阅读和常用编辑工作。
不仅仅是听音乐看视频用office而已,我相信对绝大多数人来说,通过浏览器完全可以满足日常需求的80%-90%。(打游戏除外。。。)这也是为什么google会推出chrome笔记本。

这几年发展最快的是手机/移动互联网方面。这也从根本上改变了人们使用电脑的很多习惯。比如以前PC时代几乎所有人都会用QQ或者MSN这样的即时通讯软件。linux上运行QQ和MSN也是很痛苦的事情。现在我的电脑已经不装通讯软件了,因为大部分时候都靠手机上的微信–微信完全是从移动互联网出发设计的产品,根本没有PC客户端。再比如如今越来越方便的手机支付功能,让大家对电脑端网银的依赖也逐步减少了–中国大部分银行基于ActiveX控件的网银当年也是使用linux的一道砍儿。

移动互联网之外,这些年另外一个技术趋势就是云计算云存储。其实云计算云存储的本质还是互联网,在网速越来越快以后,有了低成本硬件和虚拟化技术的支持,云的概念成为了理所当然—-这样成本低可靠性高。对普通linux用户来说,云计算云存储的出现至少能带来两个好处:可以把数据放到云上,无论在哪里都能访问了,不用像当年一样去考虑怎么跟win的机器共享文件,无论是读windows的file share还是NTFS格式都还是有点麻烦的;另外,如果你真的像我一样有时候不得不用win,那么搞一台win的云虚拟机然后远程过去也是个不错的选择,比如在Azure VM上装个visual studio。

除此之外,开源社区/linux这些年自己也有了很大进步。
这些年很多新成长起来的IT公司都是基于开源技术发展的,它们发展壮大的同时也回馈了开源社区,帮助整个开源技术一起壮大。比如大数据方面,从最早的hadoop到后来的pig,hive, storm, spark,都离不开google,yahoo,twitter等等的支持。当越来越多的先进技术是基于linux平台的之后,自然会有越来越多的人过来帮助这个平台完善。
linux现在确实越来越好用了,尤其是ubuntu这样的发行版,对普通用户很方便。以前刚接触linux的时候觉得linux的论坛里都有一种geek思维,似乎一件事情用terminal来做就是比用UI更酷;你抱怨为什么我只是想装个软件而已确要自己去编译去改config。。。他们会说这样才能自己定制,能在源代码的基础上改进。。。其实普通用户根本不需要这些。ubuntu在易用性方面做了不少工作。

当各种因素汇集到一起之后,我终于觉得时隔多年再用linux感觉完全不一样了。比如现在,我开着chrome,用豆瓣听歌,用搜狗拼音在wordpress上面敲着博客,再刷刷知乎,cnbeta,收收gmail邮件,还会偶尔看下手机的微信,一切都很好。