来说说近期很火的小众好搜引擎背后的技术

简介: 这个文章也是告诉做一个全网搜索需要用到的技术含量

这个文章也是告诉做一个全网搜索需要用到的技术含量,他们的广告:无痕、绿色、不追踪搜索。顾名思义:就是一款良心搜索,没有广告,也不推荐广告。围绕的依旧是【没有广告】并且替代F搜索的为目标。F搜很多人不知,简单说下F搜吧:

360截图20230719232147036.jpg

巧合的是好搜也是摘取了:谷歌、必应、雅虎的结果页,持续提供内容给用户,那么身为一个元搜索还有什么技术可言呢?

这个就是好搜和F搜的差异,好搜自带【数据库】所以有部分结果是来自它自己的PY爬虫,在索引,在分词,在排序,这些技术还是可以一一分析下的,现在做一款全网搜索没有以前那么难了,毕竟云厂商提供了很多模块可以付费使用的。

360截图20230719232613724.jpg

下面我就用我认知内知识普及下,大佬别嘲笑我就行。

他们的数据库使用的是阿里云或者腾讯云【MYSQL版、SQL Server 版、Redis 版】可能是定制版有可能是普通版,为啥我知道呢,第一看他们纯PHP页面和结果页面对比出来的数据,应为自有数据库存储做全网需要无限存储或者块存储,所以这3个数据库可能都会用到,爬虫应该是PY写的广深优先这个在我自己网站日志里捕获到了,蜘蛛服务器应该是是小厂的拨号(可能避免反爬吧)。

索引可能用的是百度云的搜索框去掉了框,只拿索引机制,应为我查了资料,目前就是阿里云和百度云这2家是比较接近。

分词这块用的是阿里云的【智能开放搜索 OpenSearch】排序也是这个机制套用的,加上主页的那个搜索框都是这个一气呵成的,这个模块我们公司自己也有所以对他很熟悉了。

底部关键词推荐用的也是阿里云【智能推荐 AIRec】可能是定制版。

至于自然语言这块猜想了【阿里云】【腾讯云】这2家公司产品。

下面是好搜代码,大佬可以拿去自己试试就知道个八九不离十了:

<form action="http://sl.z88888888.cn/s/" target="_blank">
<table bgcolor="#FFFFFF"><tr><td>
<a href="http://sl.z88888888.cn/"><img src="http://sl.z88888888.cn/search/images/hao.gif" alt="ZeiGou" align="bottom" border="0"></a>
<input type=text name=wd size=30>
<input type="submit" value="好搜搜索">
</td></tr></table>
</form>
相关文章
|
5天前
|
存储 安全 数据可视化
ONLYOFFICE 8.0版本深度测评:革新之作还是失望之作?
ONLYOFFICE 8.0版本深度测评:革新之作还是失望之作?
83 0
|
5天前
|
搜索推荐 开发者
开源打败商业 —— 敲敲云 apaas 平台成为了零代码领域的黑马,开启零代码新时代
随着数字化转型的浪潮席卷全球,企业对于高效、灵活的业务系统需求日益增长。在这个背景下,零代码开发平台应运而生,成为了市场上备受瞩目的产品。而在众多零代码产品中,敲敲云 以其开源的身份和高效的研发速度,彰显了其与众不同的竞争力。
166 0
|
7月前
|
消息中间件 架构师 算法
好家伙!全网开源对标P5~P7程序员技术成长路线,阿里这次是真卷
今年的程序员可以说是最焦虑的一个群体了,面试找工作投简历没人理,有面试机会也面试不过,面试进去还干不长...于是,程序员们纷纷直呼:互联网寒冬又双叒叕来了,环境不好努力也没用躺平算了。
168 1
好家伙!全网开源对标P5~P7程序员技术成长路线,阿里这次是真卷
|
Web App开发 人工智能 文字识别
一文带你了解阿里云RPA4.0背后的黑科技
今年5月,Gartner发布了RPA全球竞争格局的调研报告,阿里云RPA名列其中。随着阿里云RPA产品和生态的不断发展、客户的认可与伙伴的倾情投入,阿里云RPA有了很大的突破,并围绕“更专业、更智能、深化集成”方向,全新升级到了4.0版本,除了品牌整体调整外,阿里云RPA还对可视化开发、录制和AI等多个方面进行了重大升级,进一步满足客户业务需求,为企业数字化转型提供高效、安全、智能的服务。
一文带你了解阿里云RPA4.0背后的黑科技
|
存储 分布式计算 监控
专访骨灰级开源爱好者吴晟:开源没有黑魔法,两年后泡沫将会破灭
在刚结束的 2020 年,国内先后有超过 11 家开源软件领域企业获得了新一轮的资本助力,融资纪录创下近年来开源赛道最高。开源的热潮,已然兴起。然而,当越来越多的资本、企业等产业界人士开始越来越关注开源之时,一些隐藏在开源光鲜外衣背面的阴暗,也随之而来。
326 0
专访骨灰级开源爱好者吴晟:开源没有黑魔法,两年后泡沫将会破灭
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
|
机器学习/深度学习 数据采集 自然语言处理
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
360 0
|
机器学习/深度学习 Kubernetes 负载均衡
独家揭秘:微博深度学习平台如何支撑4亿用户愉快吃瓜?
随着深度学习在微博业务场景中的广泛使用,深度学习平台也遇到一些挑战:在离线训练方面,各业务方需求丰富多样,任务管理纷繁复杂,大数据与大模型带来训练时长的压力;在线推理方面,基于模型服务的特殊性,如何在满足微博大流量高性能的在线业务需求同时,保证服务的高可用与稳定性。新浪微博基于K8s构建了分布式离线与在线方案,解决了上述两个维度遇到的挑战。 新浪微博机器学习研发架构师于翔老师在ArchSummit全球架构师峰会2018北京站分享了《微博深度学习平台基于 K8s 的解决方案》主题演讲,介绍了微博深度学习平台概况,以及他们在离线与在线两个维度基于 K8s 的应用实践,我们对演讲内容进行了整理,希
2440 0
独家揭秘:微博深度学习平台如何支撑4亿用户愉快吃瓜?
|
机器学习/深度学习 人工智能 自动驾驶
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
AI弹幕、VR技术、5G超清......这在十年前可能都只是停留在人们想象中的文娱新体验,如今已经普及开来。如何让刷剧更“带感”?阿里巴巴文娱有答案!刷剧前下载,刷剧后阅读,8位阿里技术专家为你详解那些你不知道的智慧文娱关键技术!
18068 0
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
|
搜索推荐 自然语言处理 开发者
云栖硬核回顾|企查查搜索引擎演进之路
企查查作为企业征信行业的搜索引擎,一直以来都与阿里云开放搜索团队有深度合作。本次朱总独家揭秘,开放搜索陪伴企查查从创业初期到成为企业征信行业的独角兽的过程中,是如何满足企查查产品海量数据的精准搜索需求的。
8338 0
http://www.vxiaotou.com