账号:
密码:
CTIMES / 文章 /   
搜寻引擎下一波机会在哪里?
 

【作者: 黃柏堯】2020年07月16日 星期四

浏览人次:【801】
  

因应网际网路资讯的快速发展,网络用户要找的资料有如大海捞针,为了满足大众对於资讯检索的需求,於是搜寻引擎的服务便蕴育而生,搜寻引擎的发展已经与现代生活密不可分,搜寻引擎几??无所不搜无所不怪,人们习惯突然想到什麽,便直接打开搜寻引擎寻求答案,它对现今人类的影响力有目共睹,在此也笃定预测它对我们的影响将不仅仅是生活服务、广告与客户业务,甚至将会改变世界的样貌。


或许我们很难想像这是甚麽情况,如同90年代搜寻引擎问世,同时Web的发展才刚起步,当下面对寥寥可数的网站,有谁会相信所有的资讯都可上网查询? 然而今日将步入所谓「物联网」时代,未来利用搜寻引擎达成「万物联网,搜寻万物」的愿景,将重新改变对搜寻引擎服务功能的认知,这是一个时代的机遇,且看过去搜寻引擎的发展历史,让我们推敲物联网搜寻入囗尚未成形的症结,以及未来巨大市场潜力的真正原因。


搜寻引擎概念起始

网际网路在人类史上是一件不折不扣的大事,有了网际网路的全球化普及的硬体铺陈,全球的网际网路才能连接,因此思科无疑为网际网路发展奠定了根基。对於网路搜寻的发展概念,则可追溯1990年,蒙特娄大学三位学生Alan Emtage、Peter Deutsch、Bill Wheelan发明了Archie,当时全球资讯网还没有出现,由於大量的档案散布在各个FTP主机中,查询起来非常不便,而Archie恰恰可以自动索引Internet的免费FTP档案资讯,并提供一种根据档案名称查询所在FTP地址的方法,因此Archie被称为现代搜寻引擎的始祖。然而最早提出网页爬取资料技术的是WebCrawler,它是由Brian Pinkerton在1994年创建的,它最初是一个桌面应用程序,Brian藉此方法生成了网站的列表。



图一 : Archie被称为现代搜寻引擎的始祖。(source:Archie)
图一 : Archie被称为现代搜寻引擎的始祖。(source:Archie)

全球第一个浏览器--WorldWideWeb

网际网路发展的另一建树则是浏览器,英国科学家Timothy John Berners-Lee是全球资讯网的发明者,1990年开发全球第一个浏览器--WorldWideWeb,尽管与现今使用的浏览器大不相同,但它还是引导了浏览器发展的核心思想,随後Mosaic与Netscape进一步推动了浏览器的创新,使其具有更为直观的介面,因此在当时大受欢迎。


1994年Netscape推出第一款全球资讯网浏览器,不仅占据浏览器市场主导地位,同时开启了全球资讯网上网热潮,浏览器的发明带领用户使用网际网路可以更为简单便利,以前浏览网际网路是极其复杂的,只有电脑专业人士才能上网,浏览器开启了只要会用滑鼠和键盘就会上网的可能,毫无疑问,浏览器拉近了人类与网际网路资讯之间的距离,大大减少了人们搜寻资讯的时间成本,Netscape浏览器也成为了日後浏览器的发展原型。


网际网路拓荒者--Yahoo

尽管拥有了浏览器的上网便利,茫茫网际网路中寻找自己想要的网站依然困难,1994年引发着杨致远 (Jerry Yang) 和David Filo对网站的探寻,两个年轻人创建一个分类查询目录,存放着两人找到的网页并发布到网络上。


分类查询其实是一个很简单的创意,他们将它命名成 "Jerry and David's Guide to the World Wide Web”,其核心就是按照字母顺序将站点分类,Yahoo的雏形因此诞生,它制订了网际网路这个行业的游戏规则开放、免费和营利的新型商业模式,1996年Yahoo成立仅一年,便创下了上市时间最短的奇迹。


1998年Yahoo成为世界最大的网际网路公司,当此巅峰际遇却发生了转折,搜索资讯一直依靠人工进行,未能以HTML的Meta叁数导向自动化搜索技术,此外,1999年拒绝主动上门以100万美元收购的Google,因为Yahoo一度认为用户上网动机,在於浏览资讯,不存在目的性搜索,更要命的是,2000年还把搜索功能交给Google完成,无形中扶持了竞争对手。



图二 :  Yahoo起始制订了网际网路产业的游戏规则开放、免费和营利的新型商业模式。(source:Yahoo)
图二 : Yahoo起始制订了网际网路产业的游戏规则开放、免费和营利的新型商业模式。(source:Yahoo)

现代搜寻引擎创建者-- Google

Google搜寻引擎的发展,始於1996年1月Larry Page和Sergey Brin,在史丹佛大学研究关於搜寻的专案,1997年W3C(World Wide Web Consortium)定义HTML的Meta叁数,创建了搜寻引擎自动化搜索的环境,鉴於网页上只有向外的连结网址,但无法看到指向这个网页的连结的数量。


为了实践网站连结数量决定排名的「Page Rank」机制,於是他们开始尝试建立一个大量连结的资料库,藉以找出每个网页的连结会通向什麽网站,因此现代搜寻引擎架构爬取 (Crawling) 、索引 (Indexing) ,也进而创建出排序 (Ranking)的机制。Page和Brin将这个搜寻引擎命名为「BackRub」,他们的构想在1998年8月获得Sun Microsystems十万美元的投资,继而1998年9月他们在车库建立了公司,搜寻引擎更改为「Google」名称。Google的搜寻引擎架构收集全球资讯网快速成长,根据GoogleBlog公布索引资讯数量,1998年仅为25万笔,2000年便成长到10亿6千万笔。



图三 :  Google的搜寻引擎架构收集全球资讯网快速成长。(source:Google)
图三 : Google的搜寻引擎架构收集全球资讯网快速成长。(source:Google)

搜寻引擎的潜在商机

机会其实就在人人耳熟能详的「物联网」,物联网最终以「万物联网,搜寻万物」愿景为目标,潜藏的市场指向线下的大数据蓝海商机,然而提供线下搜寻与大数据服务的关键枢纽,实质的运作机制便是线下搜寻引擎,它可以接管用户未来的生活服务,也接管未来实体世界的广告与客户业务,所以未来商店将不再需要招牌广告,街头的样貌与生活方式因之改变,社会中的各层面资讯效能也因之提升,进而达到「人尽其用,货畅其流」目标。


对於现有的市场规模估算,根据易观智库2019年中国线下市场数据显示,占据社会消费零售总额80%市场,是线上消费零售总额的四倍,规模达到大约30兆元人民币,此将是中国线下导入线上发展的潜在商机,而全球线下市场的潜在商机可达16兆美元,所以物联网商机可谓十分钜大,虽然潜在商机并不等於物联网平台的交易产值,但指标意义在於等同的市场覆盖范围,这也是线下搜寻引擎可以拓展市场的最大范围。


线下搜寻入囗的发展现况

当今网际网路进入行动服务时代,服务型态着重於用户与实体资讯的连结关系,开始导向以人的位置为中心的服务价值,因此线下服务搜寻的需求与日俱增,然而搜寻引擎技术历经90年代飞跃进展,转眼已超过二十年光景,时至今日仍难以得见线下搜寻引擎身影。


综观现有线下搜寻应用形式,最大的改变就是普遍以App做为线下搜寻应用(应用例如,Uber、Mobike、Foodpanda等),但主流App采用资料串接架构,实际上是一种封闭系统,难以如同开放性的Web系统,去发展跨应用跨服务的整合入囗,加上用户安装App数量十分有限,致使大部分App在用户端没有市场。


根据统计排名前十的App囊括85%以上流量,而且高达90%以上的??尸App,形成严重的软体资源浪费问题。虽然市面上已发展跨应用整合的线下搜寻入囗,例如微信小程序、Amazon智能语音服务,Google地图等系统,但这些方案整合线下移动服务的方法,几??着眼於串接App应用,对照搜寻引擎技术的发展布局,似??仍然欠缺完善架构与发展机制,因为服务源头并非来自开放的Web资讯,而是意图将主流的App应用导入自家的系统,在山头林立且互抢资源的情况下,未来能成为线下搜寻入囗的机会其实不易达成。


线下搜寻引擎发展的症结

若把网站比喻成一项商品,商品的自由流通将保证市场最大繁荣,网际网路上的各个网站可以从搜寻引擎分享资讯并带来流量,搜寻引擎如同组织一个云端世界,将所有的云端的服务与资讯连结起来,利用关键字搜寻Web内容,水平整合不同应用领域,达成跨领域、跨服务的资讯流通机制,所以若要突破App线下资讯流通的瓶颈,达到开放共享的最大服务价值,最终需要倚重一个线下搜寻引擎做为推手。


自2008年行动服务市场爆发以来,APP便成为了手机用户的核心应用,因为便利於获取用户方位资讯,所以线下应用几??采用App方案,为了解决App资讯流通的根本问题,线下应用发展需回到Web方案,然而全球资讯网W3C仍未制定HTML线下应用规范,故全球开发者无法着力在Web线下应用开发,进而导致线下搜寻引擎也无法实现自动化资讯汇集机制。


於此之际,据悉「大千搜寻」平台业已发展线下搜寻引擎,也据闻「微信」正在布局相关的线下搜寻方案,不过现阶段无法以自动化资讯汇集机制,搜索资讯仍需依靠人工勘查,然而目前的线下服务应用几??采用App方案,以人工搜索适用的Web线下应用资讯,资讯数量将极其有限,最有效益的做法是将线下应用规范,提案到W3C协会成为HTML标准规范。


结论

尽管网际网路的创新多如繁星,搜寻引擎始终是那颗最耀眼的明星,因为网际网路前进的脚步,需要搜寻引擎巨轮带领,所以几??没有其他平台可以超越其价值,因而Yahoo曾经造就最大的网际网路公司,Google得以缔造全球市值第二的纪录,也从过去的发展历程得知,成就伟大的公司的关键在於适时创新,但创新并非需要创造十分艰难的技术,比如Yahoo创建的分类查询机制,则是以普通分类概念达成创新应用,而Google搜寻引擎的爬取与索引方法,则源自WebCrawler与Archie的第三方创意,而网站以被连结数量决定排名的「Page Rank」机制,则延伸自百度创办人李彦宏的专利,事实上这些技术在一般软体工程师眼中,并非具备甚高的发展门槛,而真正获取成功的核心关键,则在於掌握最隹时机,提出一个创新应用想法与发展架构。


(本文作者黄柏尧为大千资讯科技创办人兼执行长)


**刊头图(source:FRIS)


相关文章
数位分身不乏术 动员感测、资料分析与整合科技
5G与边缘互为体用 体现完美分散式运算
理解人工智慧:训练
在物联网中添加【物】的六种方法
边缘运算四大核心 实现海量资料处理的最隹布局
comments powered by Disqus
相关讨论
  相关新品
Pad(MID) SiP Turnkey Solution
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
  相关新闻
» 工研院串联产官学研医 成立智慧长照大联盟
» 法新创 Energysquare 首海外办公室落脚台湾
» 展现台湾生医能量实力 国际防疫共创新商机
» 韧性台湾推动後疫产业发展 工研院倡议转向智慧价值思维
» 科技部创新创业激励计画聚焦新锐决选胜出
  相关产品
» 宸曜推出新款IGT-30系列工业等级物联网闸道器
» Digi-Key宣布推出供应商主导的KiCad资料库
» Canon全方位智慧商务解决方案聚焦企业转型未来
» 红帽开放原始码技术协助乐天行动网路公司端对端云原生行动网路
» Marvell革新边缘资料中心交换技术

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw