亲,双击屏幕即可自动滚动
正文 第1821章 我们做,但要有底线
    李明衝进贾瀞雯办公室时,手里攥著一沓列印纸,手指都在发抖。

    “成了!贾总,成了!”

    贾瀞雯抬起头:“什么成了”

    “分布式索引!”李明把列印纸铺在她桌上,“你看,测试数据!搜索响应时间平均缩短了百分之五十!最快的时候能达到零点八秒!”

    贾瀞雯拿起数据报告。

    表格密密麻麻,但结论很清楚:新技术让的速度提升了一半。

    “怎么做到的”她问。

    “我们把索引彻底打散了。”李明在白板上画图,“以前是集中式索引,所有数据在一个大库里,查询要遍歷整个库。

    现在是分布式,数据按关键词首字母分片,存在不同的伺服器上。

    查询时,系统自动定位到对应的伺服器,只搜那一片数据。”

    他顿了顿:“就像图书馆以前把所有书堆在一起,现在分门別类放不同房间。

    找小说去a房间,找歷史去b房间,不用把所有房间都翻一遍。”

    贾瀞雯看著数据,心里一阵激动。

    这意味著,百度的搜索速度將达到一个新高度,甚至可能超过那家美国公司。

    “稳定性呢”她问。

    “测了一周,没问题。”李明说,“而且分布式架构更健壮。

    一台伺服器宕机,只影响一部分数据,其他还能正常服务。

    不像以前,主库一掛,全瘫。”

    “太好了。”贾瀞雯站起来,“马上部署,儘快上线。”

    “等等。”李明说,“还有件事。

    陈总昨天打电话,提了个新构想。

    他说……光快还不够,要更聪明。”

    “什么意思”

    “个性化排序。”李明翻开笔记本,“陈总说,现在的搜索结果是基於全网数据,对所有用户都一样。

    但不同用户的需求不同。

    比如搜『苹果』,程式设计师可能想找编程资料,果农可能想找种植技术,普通用户可能想买水果。

    如果能根据用户的歷史行为,给每个人个性化的排序,体验会更好。”

    贾瀞雯思考著这个构想。

    听起来很先进,但……

    “这涉及用户隱私吧”她问。

    “对,所以陈总让我们先做伦理研討。”李明说,“技术上是可行的。

    我们可以记录用户的搜索歷史、点击行为,建立偏好模型。

    但这个数据怎么用,边界在哪里,得想清楚。”

    当天下午,贾瀞雯组织了伦理研討会。

    参会的有技术核心、產品经理、法务顾问,还有新成立的用户体验团队。

    会议室里爭论得很激烈。

    技术负责人张涛说:“从技术角度看,个性化是未来。

    网际网路信息太多,用户需要过滤。

    我们帮他们过滤,这是服务。”

    產品经理王磊摇头:“但你怎么知道用户想要什么靠歷史行为推测,可能推测错。

    而且用户会担心:我的搜索记录被保存,会不会泄露隱私”

    法务顾问李律师推了推眼镜:“法律上目前没有明確规定。

    但用户隱私是敏感问题。

    如果我们要做,必须有严格的数据保护措施,还要给用户选择权——要不要开启个性化。”

    用户体验团队的刘明说:“我做过用户调研。

    大部分用户希望搜索结果更相关,但確实担心隱私。

    如果能有折中方案就好了。”

    贾瀞雯听著大家的討论,在白板上写下关键点:技术可行性、隱私边界、用户选择权、数据安全。

    “这样吧。”她最后说,“我们做,但要有底线。

    第一,数据必须匿名化处理,不关联具体用户身份。

    第二,用户可以选择是否开启个性化功能,默认关闭。

    第三,数据加密存储,定期清理。

    第四,明確告知用户我们收集什么数据,怎么用。”

    “如果用户选择关闭,还收集数据吗”王磊问。

    “不收集。”贾瀞雯说,“只有开启的用户,我们才记录行为。

    而且用户隨时可以关闭,关闭后数据立即刪除。”

    【跪求礼物,免费的为爱发电也行!】
为您推荐