3)第四十章 搜索引擎算法_重写科技格局
字体:      护眼 关灯
上一章 目录 下一章
  该都是更大的。

  所以在我的算法中,对于指向某一个网站的链接,我首先会做垂直率评分,比如有现在有10个网站链接到了A,这10个网站都是汽车类网站和这10个网站都不是汽车类网站的结果,想必是肯定不一样的。

  这里还有一个小小的心理问题,那就是同行之间很少会做超链接,所以拥有更多垂直类网站链接的网站,它的专业性肯定比被乱七八糟网站链接的网站要更大概率靠谱。

  第二,建立关键词库热度排序机制,现在的几家搜索引擎企业都对网页做了排序,而我对关键词也做了排序,而且给关键词做排序非常简单,那就是看用户的搜索量。

  就比如今天搜索汽车的用户最多,那么汽车的评分可能就是10分,这个时候,算法会分配更多的资源到汽车相关的信息上去,去抓取更多的优质网页。

  这里有四个好处,提升信息反馈速度、增加热点反馈的时效性、节约计算机资源以及围绕最终目的,让更多使用我们搜索引擎的用户得到有用信息。

  第三,用户反馈机制,也就是跟踪用户的点击情况和浏览情况。

  还是用汽车举例,有100个用户搜索汽车后,80个点击了A网页,A网页的评级就会上升,如果有更多的用户在A网页的停留时间较长,A网页的评级也会上升,如果有更多的用户在A网页上直接进行链接等操作,A网页的评级也会上升。

  也就是说,在整个网页评级系统中,加入用户反馈分。

  第四,规律算法,在用户的所有行为中寻找大概率行为,并将这些大概率反馈到人工,比如说60%搜索了汽车的用户下一个搜索词都是保险。

  这样的一些规律我们是无法预测的,但我们可以利用算法进行大数据挖掘,回馈的这些结果可以供人工分析部对一定的网页进行评分,这个就是人工分。

  结合以上四点,在我的算法下,任何一个网页同样会有一个分数,我称其为精度分。

  影响精度分的因子包括自己评分,链接的垂直网站评分,用户反馈分,人工制定分以及外链影响等。”

  之后,孟谦浅尝辄止的展示了各个分支的算法逻辑和算法推演公式。

  然而就在孟谦在说最后一个规律算法的过程中,来自IBM的杰尔夫突然起身惊呼,“OHMYGAD!ArtificialIntelligence?!”

  孟谦转过头看了一眼对方,皱了皱眉。

  杰尔夫顿了顿,以为孟谦是没听懂,用奇怪的发音道,“卧槽!!!”

  ...

  而随着杰尔夫的打断,原本都沉浸在孟谦分享中的其他四名技术人员,眼神也都出现了明显的变化...

  请收藏:https://m.biquge74.com

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章