在2017年初,YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?
成为中国YouTube,这估计是每一家国内视频网站都曾经设想过的目标。现在,无论是从全球市场规模、还是从营收规模上来说,YouTube都已经是一个庞然大物。而在国内,至今已难以找到一家能够与YouTube实力相当,甚至说模式相似的视频网站了。
差异是如何产生的,已经成为一个可以写成商业专著的选题了。而这一次我们则关心一个更为细节的产品技术问题,那就是在YouTube上早已实现的自动字幕功能,为何没有在国内的主流的视频网站上出现?
据报道,在2017年初,以UGC起家的YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次,而且目前已支持全球10种语言的自动字幕加载,以及支持包括简体中文在内的上百种语言的机器翻译。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?
也许你之一反应会想到技术原因。也是也不全是。毕竟近几年,我国在自动语言识别上面的技术早已成熟,在视频网站上应用也许早已不成问题。
“是不为也,非不能也。”如果孟老夫子在世,可能还会说出这句话来。但原因究竟是啥,恐怕还是要继续追问下去,而最终我们其实还是想对这些国内视频网站的新老玩家们提问下:这么“香”的技术,到底要不要学习一下呢?
自动字幕:从Goodness到BusinessYouTube的自动字幕功能是在2009年由谷歌的工程师们开发的,那时离谷歌收购YouTube已经过去三年了。这一功能的初衷是,通过将视频声音转化成文字字幕,为全世界有听力障碍的用户提供便利。而开发这一功能的软件工程师肯·海伦斯坦也正是一位聋哑人士。
众所周知,YouTube是从用户UGC视频内容起家的,目前仍然是全球更大的UGC视频网站。当前月用户访问数可以达到18亿,用户每分钟上传视频时长达到400小时,并且时长还在增长。
这同时意味着,有大量上传的UGC视频中是没有主动添加字幕的。这对于正常听力的用户来说,并没有什么影响,而对于有听力障碍的人来说,则相当于缺少了极其重要的音频信息。
而自动字幕的加入,则在一定程度上帮助了听障用户获取更多的信息渠道。
目前,谷歌和YouTube团队正在利用机器学习为自动字幕增加音效信息,从而更大程度地丰富音频内容的表达。通过添加如 *** 、狗叫声、敲门声等音效字幕,也正是出于改善聋哑或听障人士的观看体验而进行的技术改进。
这样一项出于社会责任感和用户公平体验的技术,也带来了额外的市场推广价值。
随着自动字幕可以识别的语种的增加,以及自动翻译功能的加入,这一项技术成为一项全球用户都可以受益的功能。比如,大量优质的英语原声知识分享视频可以通过自动添加英语字幕,再转为其他语种,供非英语区的用户观看学习。这显然对YouTube的全球化推广产生了积极的推动作用。
在每天上千万次的自动字幕的使用中,语音识别难免会出现一定错误。但随着YouTube社区用户对这些自动字幕信息进行评论和编辑后,这些信息又会再进入机器学习的流程,从而帮助自动字幕系统更好地提高准确率。同时,自动字幕及机器翻译准确度的提升,又推动内容推荐的精准度的提升,进一步增加用户粘性和使用时长。
一项帮助提升用户体验的AI技术,又在用户的海量数据的帮助下变得更加强大,很好地印证了“科技向善”可以带来更多意想不到的好处。
当然,这里有一点比较遗憾的地方是,如果你有机会使用YouTube的中文简体的自动翻译功能的时候,你可能并不好理解翻译出来的中文到底在表达什么意思?
一来,可能视频中中文口语化的音频内容确实不好翻译;二来,由于你懂得的原因,这个自动翻译的数据模型并没有得到有效的训练。
那么,自动字幕如此得天独厚的市场空白、如此巨大的应用规模,以及如此现成的技术条件,为什么没有国内的视频网站主动去使用呢?
为什么国内视频网站们“主动”错过这一技术?编辑导读:业余时间刷视频已经成为了人们的娱乐方法,海内短、中、长视频形式多样,视频平台与电商平台相互渗透,形成一种新的贸易形式。前不久,谷歌开始机关电商,在将来观众可以直接在YouTube上购置商品。...