第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

进军教育搜索 百度搞不定的三件事

时间:2013-05-15 00:00来源:网络 作者:yangyang 点击: 我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
张迪欧 据报道,搜索引擎巨头百度开始涉足教育培训领域,低调测试一款新品。当用户在搜索栏中输入雅思培训时,搜索结果直接显示教学机构名称,其搜索深度已经接

  张迪欧

  据报道,搜索引擎巨头百度开始涉足教育培训领域,低调测试一款新品。当用户在搜索栏中输入“雅思培训”时,搜索结果直接显示教学机构名称,其搜索深度已经接近课程级。这在教育培训行业是个爆炸性新闻值得分析关注,因为此举有可能改变教育行业的推广格局。但是让我们抛开百度的大平台效应 ,仅从教育行业规律出发,以沙盘演绎的方式分析之后,至少目前我认为,百度教育搜索应该有三件大事儿搞不定。

  

百度开始涉足教育培训领域

百度开始涉足教育培训领域

 

  第一个搞不定:课程数据是个黑洞。

  如果百度此举是为了提升搜索体验,那必定要采取搜索引擎爬虫的方式向全行业抓取数据。否则如果百度的不抓取数据而是要求教育机构自行提交数据的话,此举将只是凤巢推广系统的一部分;这一点咱们暂且不表,留在下文言说。

  先谈谈搜索引擎爬取的问题。可以说,所有的行业里,教育培训领域的课程数据整合是最难的,甚至难到了在逻辑上都不能验证通顺的程度。我之前参与过一个教育类垂直搜索引擎的项目,那一段时间最大的噩梦就是数据问题。之所以最终选择了网络教育,就是因为网络教育的课程数据具有一定程度的可实施性。而百度这么大的动作不可能只满足于网络教育,他们的指向应该是全行业的线下教育搜索,于是,问题马上就要来了。

  首先是数据的规范性极低,无法统一展示。教育行业的本质是服务,依从不同的学科拥有不同的服务特征,不同的机构则有不同的课表标准。就拿课时来说,A机构说的是课时,B机构谈的是学时,C机构干脆就按小时计费,D机构说一个月是个培训期,E机构也谈课时,但他们的一课时是30分钟……再说班型的概念,不同机构的班型定义不一样,班型本身千变万化,而且还有同样概念不同名称的班型。仅网络教育的现有机构,网校网抓取的班型就将近300种,更何况线下教育的庞大集群。再从教育机构来看,有的机构以教师引领,有的机构以教学的组织引领,有的是一对一教学,不同的学校理念不同,课程设置不同,促销方法不同,甚至基本的名词定义都不同。这个不像实物商品,实物商品属性是基本规范的;也不像饭馆,饭馆是以“店”为单位去组织的。教育搜索引擎如果想做到真正的服务深度,那么必须以“课”为基本单元(百度目前就是这么做的),这就相当于搜索到饭馆里“菜品”的级别了。在这种极不规范的市场下,根本无法实现这种级别的抓取。如果百度提出自己的标准,教育机构能否按照百度的指挥棒去执行?如果百度把这些属性强行整合,那么又如何为用户提供准确服务呢?

  第二,课程数据难以抓取和更新。假定课程已经规范,但教育领域的网站之千姿百态是大家所公认。即便一家网站,不同学科的页面html规范都不同,更有甚者,教育机构的课程介绍基本以课表形式展示,这需要人类的智能去读懂。百度爬虫如何能把这么多种不同的HTML,把这么多不同逻辑的表格都爬取拆解整理入库呢?这是人工智能领域的一大难题,恐怕百度难以解决。即便真的做到了,那么教育机构的课表变化,搜索爬虫的更新频率能跟得上么?当然,百度可以让教育机构主动提交信息,这个在后文将进行探讨。

  第三,数据量之大难以想象,而教育培训是线下服务,对于用户必须就近选取。那么全国有30多个省份,N多城市,地区可以算作一个维度;教育培训的学科非常多,线下教育学科上千不止,这又是个维度。这两个维度就能衍生数万个区划,每个区划里有N多机构,再加上班型、上课时间等维度,再加上日常更新维护,这个数据量对百度而言也许不算什么,但数据精准程度就不好说了。

  所以如果百度以搜索引擎的方式解决教育领域精准搜索的问题,只能牺牲量而求质,求质就得推广少数机构,推广少数机构就变成了付费推广,成了凤巢系统的一部分,就成了广告行为。反过来,如果求量而牺牲质,那么这种数据黑洞解决不了,质量不高,百度费力不讨好。

  第二个搞不定:搜索展示页空间不足,在产品层面解决不了教育领域的问题。

  前文中已经铺垫过,即,如果百度采取让教育机构推送课程数据的方式,像传统的竞价系统一样,只有付费的机构才可以推广,那么这种方式与百度的页面如何融合,与用户的阅读习惯如何融合,如何提供充分的展示空间,这将成为UE设计师的噩梦。

  众所周知,搜索引擎SEM推广占领的就是搜索结果首页首屏的位置,而这个页面总共才有3到4屏。传统搜索结果里,一条搜索结果的Title和Description最多有四五行;但在百度教育搜索测试页面展示的,除了每条课程信息占据4行之外,顶部还要挂上筛选器,筛选器就占据了一大块空间。而且我们已经看到,这4行格式化的课程信息,其作为商业数据,行高一定要高于传统的文本。也就是说,百度教育搜索的搜索结果页与普通搜索结果页相比,要吃掉大量的高度,会把页面拉长很多,这很考验用户耐心。

  如果UE工程师能很好地解决这个问题的话,那么还有个更可怕的问题根本解决不了,这就是展示单元的问题。百度按照测试页面的样子展示课程数据,其基本的单元就是“课”,而不是“校”。如果旧的搜索方式中,一个搜索结果页列表能最多容纳20个教育机构广告的话,那么新的教育搜索,一个页面最多只能容纳20条课程。如果用户想多看就只能翻页了…… 如果这样的话,用户不骂街才怪。

  用户会不满,教育机构也会骂街:“以前20块钱一个点击,我的机构介绍能上首页首屏第一位,现在20块钱一个点击,我的机构只能上一个课程在上面,还没有自我介绍的地方。”

  产品经理肯定会很委屈,那么就把这种教育搜索缩成小块放在顶部吧,也会遇到同样的问题,在小块里展示校还是课?展示“校”,和以前相比意义不大;展示“课”,每家教育机构的课都足够这个小框里翻页N次,这么多机构如何展示完全如何排序呢?如果竞价的话,如何按“课”向教育机构收费呢?教育机构会满足么?

  总之,我们看到,百度很好地解决了视频、新闻、商品、机票等搜索问题,但进军教育行业恐怕不会如此一帆风顺。教育培训行业是个非常特殊的领域,数据的特殊性造成课程商品很难统一搜索统一展示。这个问题不解决,不仅无法满足公众用户的搜索需求,而且也会遭到教育机构的不满,因为大机构即便砸钱占版面恐怕都难以满意,而小机构的生存空间会被大量吞噬。

  第三个搞不定:仍然解决不了欺诈广告的问题,反而将承受更多的抱怨。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕