注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

 
 
 

日志

 
 

Twitter的100亿条信息带来的BUG  

2010-03-06 22:05:38|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

今天上午的Twitter信息统计显示,Twitter信息发送总量已经突破100亿条。此时距离Twitter信息总量突破50亿条仅过去5个月。

  这个消息对Twitter来说是个好消息,但对于使用我先前开发的GAE同步程序的用户来说是个灾难,因为原先程序有个BUG,在Twitter信息量大于100亿条的时候会出现,导致用户的Twitter的ID号码在10000000000之后的信息会反复发布。

  造成这个问题的原因是因为原先的数据排序通过id号进行,当id号升到11位的时候,该数据的排序错误,反而排在10位的id号后面。

  目前我已经做了一个补丁程序twitter.py,修正了这个错误,使用时间来进行排序,彻底解决了这个问题,原先使用我这个程序的用户,请下载最新的twitter.py代码后重新发布,就会解决信息重复同步的问题。

  手动修改方法:找到id=db.StringProperty()一行,在后面增加一行created = db.DateTimeProperty(auto_now_add=True) 。找到msg=db.GqlQuery("SELECT * FROM Twitter ORDER BY id DESC")一行,将其修改为msg=db.GqlQuery("SELECT * FROM Twitter ORDER BY created DESC"),最后使用appcfg.py更新即可。

  项目地址:http://code.google.com/p/twitter-feed/

  SVN Checkout地址:http://twitter-feed.googlecode.com/svn/trunk/

原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/2106.html

  评论这张
 
阅读(114)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017