音乐识别服务已支持识别变调变速歌曲

变调变速音乐检索

电台DJ和电视节目中经常会因为节目需要,对歌曲播放的快慢和节奏进行改变。这种做法会改变歌曲的声音频率,俗称变速变调音频指纹技术的技术原理是提取声音的特征码进行比对,针对变频歌曲,声音指纹也会与原始文件不一样,识别变调变速内容是声音识别领域的一大难题。

针对广大国内外客户针对变频歌曲识别的需求,ACRCloud经过研发,已支持音乐原声的音频指纹对变速变调歌曲的识别,从而满足了各类电台,电视台针对变频广告,音乐的识别需求。

目前支持变调变速的服务版本已全面上线,国内用户可注册平台console.acrcloud.cn进行使用,国外客户可使用console.acrcloud.com注册,关于海外服务分区信息,请参考http://www.acrcloud.cn/launch-of-us-spot

 

美洲节点正式上线

服务器节点(中文版)

针对需求日益增加的欧美客户群体,ACRCloud正式推出美洲节点的音频识别服务。

至此ACRCloud音频识别服务已全面覆盖全球主要国家和地区:

亚洲(北京):服务中国境内用户

亚洲(新加坡):服务亚洲除中国外其他国家用户

欧洲 (爱尔兰):服务欧洲,非洲用户

美洲 (美国俄勒冈):服务北美洲,南美洲用户

服务器和节点配置信息

如何更换服务节点:

国际版:console.acrcloud.com 进入后选所在区域

B8EC7345-AF44-4003-8DBE-9F041FB6A478

中文版:console.acrcloud.cn进入后直接使用国内版

多米音乐全面接入ACRCloud音乐识别服务

多米

近日在多米音乐Pro 6.5.6版中,音乐识别功能重新上线,服务提供商由原有的国外知名服务商Gracenote更换至ACRCloud。至于此次更换服务的缘由,多米音乐向ACRCloud反馈了用户经常遇到的一些问题如:中文曲库不全,歌曲识别缓慢和无法支持用户哼唱搜索等几大主要因素。ACRCloud针对多米音乐的上述需求,定制出一套针对多米音乐曲库的识别解决方案,支持新歌每天更新,识别速度平均在5秒以内,并且在原声搜索的基础上增加了哼唱搜索功能。目前内置ACRCloud音乐识别服务的安卓和ios版多米音乐应用都已上线,更好的服务于多米热爱音乐探索的用户们。

ACRCloud音乐声音指纹检索服务拥有4000万全球歌曲声纹曲库,同时支持用户对旋律哼唱的搜索。目前已服务于小米音乐,乐视云,吉他大师,台湾Omusic,美国Peach,意大利Lyrics Mania 等国内外知名应用和服务。

版权防卫战中的十八般技法

版权防卫战中的十八般技法

作者:孟玛  来源:中国新闻出版广电报   发布时间:2015年10月22日

音乐版权保护

不少作品自诞生之日,可能其盗版就和正版如影随形。在版权攻防战中,盗版和正版的保护形成了博弈态势,在不断地纠缠、竞争和超越中,形成了各式各样的版权保护技术。放眼当下,我国各类作品的版权保护技术可以大致列举如下。

地图、词典等作品:“暗记”和“埋雷”

在著作权侵权判断中,“错误沿袭”是重要的判定依据之一,因此一些地图作品的著作权人,往往在地图作品某些位置上设置“暗记”。比如在交叉路口画一条看似多余的短线(但实际道路并非如此),这就是一种没有表达任何地理信息意义的特殊标记,仅仅是起到发现和证明侵权的作用。这种方法目前被很多地图生产商所采用,又被称为“埋雷”,可以在一定程度上保护作品的合法权益,并可以作为对方侵权的关键证据。

图片作品:“水印”技术和“纽扣”技术

目前,网络电商平台成为图片作品侵权的“重灾区”。很多电商平台商铺经营者辛辛苦苦制作了各种精美的商品展示图片和模特图片,却在一夜之间被“复制粘贴”在无数个其他同类产品竞争者的店铺展示区。对于这种分散式的侵权而言,图片作品的权利人在侵权发现、举证和维权上都需要付出极大的经济成本。在此背景下,相应的版权保护技术应运而生。最为常见的是“水印”技术,即在原创图片或照片上打上水印。例如,“华盖创意图片库”,号称全球最大的商业图片素材网站,对图片保护的措施之一就是打上“华盖创意”的水印作为版权标识。

但是,“水印”技术也存在不足之处,因为侵权者完全可以通过图片编辑技术去除或者遮盖水印。于是,又出现了一种“数字纽扣”技术。据报道,这种技术又被称为“图片护盾”,由阿里巴巴研发,根据技术专家介绍,这种技术应用后,上传原创图片的淘宝网卖家可以选择使用“图片护盾”保护。这样一来,图片上传后,通过给图片加上肉眼看不到的水印来确保图片的安全。如果盗图者通过“复制粘贴”再次上传这张图片的话,系统可实现自动拦截、自动处罚,而不需要权利人选择是否发起投诉。即使盗图者对图片做了缩放、拼接、剪切等人工编辑,系统还是能够发现并予以制止。

音频作品:“音频指纹”和“音频水印”

目前,业内存在的较为先进的音频版权侦测技术是所谓的“音频指纹”(如ACRCloud),其原理是通过监测视频库或用户上传内容的音频指纹,相关监测服务平台可将视频中使用音乐的歌名、歌手、播放时长等相关数据提供给服务运营商,供其判定是否侵权。该技术可广泛应用于互联网、电台、电视、有线、卫星中传输内容的音乐识别。该技术通过检测海量音频的指纹库实现监测,因此一般需要配置高性能的计算机设备。

除此之外,据报道,前不久,爱奇艺发布了一种新的音频版权侦测技术——“音频水印”,即通过在音频中植入加密的版权信息,实现低成本、快速、高精度的版权识别。该技术具有运算量小、耗时短、成本低廉的优势。即使音视频内容经过处理,水印信息也不易丢失。版权的识别可以通过软件快速扫描自动完成,甚至可以通过手机应用软件实现检测,从而大大提升了可操作性。

视频作品:“加密”技术

目前,网络的各类在线课程视频成为视频作品侵权的“重灾区”。在此背景下,知名的在线课程分享平台“百度传课”针对性地推出了最新“内容数字版权加密保护技术”。据报道,该技术要点在于给视频内容增加加密壳,只有通过服务器获取密钥才可以完成内容播放。换言之,当视频内容添加这一技术后,即使通过不正当手段下载了“百度传课”的视频,也无法在无授权的情况下播放,这就杜绝了盗版者再售卖的可能。据称,由于此种密钥是由百度传课通过私有算法产生,因而安全性得到了很大保障。

软件作品:“时间戳”技术

在后网络时代,“谁是原创”已经成了最常见的证明难题。由于版权是自动产生的,不需要登记注册,因此难以证明。尤其是数字化作品,缺少物理有形的创作证据,使企业保护版权变得更难。在此背景下,“时间戳”技术应运而生。

“时间戳”是时间戳服务中心通过我国法定时间源和现代密码技术相结合而提供的一种第三方服务,将处理电子文件时的精确时间嵌入文件编码之中,形成了不可改动的时间记录,因而可以证明电子文件(数据电文)在某一时刻存在的真实状态,是具有法律效力的电子凭证,可以证明电子文件的创建时间及其内容的完整性。按照《中华人民共和国电子签名法》的有关规定,加盖了“时间戳”的数据电文可以证明其在一个时间点是已经存在的、完整的、可验证的,其数据保密性、完整性、不可伪造性、不可否定性等特性,符合《电子签名法》第五条对原件形式要求的规定,具有很高的证据效力。因此,只要及时申请“时间戳”,获得第一时间作品存在及内容完整性证明,日后若有人仿冒或抄袭该作品,只要拿出“时间戳”证据,谁是李逵谁是李鬼就一目了然。

但是,从“时间戳”的产生原理来看,其在证据方面仍然存在一定的局限性:第一,在客观真实方面仍然存在作品被他人抢先盖戳的可能性。因为权利人为作品加盖“时间戳”时,受理部门无法对其作品的合法性进行判断,有人可能拿他人的作品来加盖“时间戳”,这会造成更多的版权纠纷。第二,对于一些内容较多的版权文件而言,提交盖戳的内容只是一部分,这就使得其证明的意义只能是初步和局部的,在与其他形式的证据相抵触后可能被推翻。例如,在司法审判中,通过“时间戳”对作品进行保护的形式可以作为证据之一,但若权利人同时以版权登记和加盖“时间戳”的作品举证,一些裁判者可能会优先选择版权登记作为证据。又如,在已经生效的应用“时间戳”的案件中,“时间戳”证据大多需要和其他证据结合形成证据链才能指向某一事实。

版权保护技术需“量体裁衣”

除了上述的典型代表外,目前的版权保护技术还包括反复制技术、追踪技术、标准系统和远程侦测技术,不一而足。事实上,无论何种版权保护技术,总是存在特定的“技术软肋”。作为著作权人,需要量体裁衣、因时制宜,选择最佳的版权保护技术或者同时使用若干技术构成完整的保护体系,这样才能打造最为完善的作品保护防御体系。

 

MIUI整合歌曲识别解决方案ACRCloud

MIUI整合歌曲识别解决方案ACRCloud

转载Mashable

xiaomi

想必很多人都曾遇到过对歌曲的某个片段非常熟悉又或者唱着或者哼着曲调,但却无法想起歌名和歌手,ACRCloud则帮助解决这个问题,借助超过4000万首的歌曲库来识别曲调显示可辨识的歌曲。根据ACRCloud今天发布的公告,在最新的MIUI更新中为其提供歌曲识别软件,用户能够播放、哼或者唱曲调就能利用ACRCloud的庞大数据库来识别。

 

http://static.cnbetacdn.com/article/2016/0218/360c9c198857234.jpg

 

在成功识别之后,用户有权限直接播放和下载这首歌曲。目前,这项功能还在测试阶段,并将会整合至小米的“Mi Music”中,将会在下个月面向数百万小米MIUI用户开放。

Syntec TV接受流媒体网专访

Syntec TV接受流媒体网专访

作者:蔡庆    来源:流媒体网    发布时间:2015/4/16 7:06:28
lmtw
 春晚的微信摇一摇摇壮了微信,摇“坏”了电视台,本来想通过与微信合作来增加收视率的春晚以及各电视台,反而被微信“反咬一口”,将用户注意力转向了微信。今年的春晚收视率再创新低,仅为28.37%。那么,电视台又该如何把握住自己的受众呢?

近日,流媒体网对话电视互动解决方案公司Syntec TV,针对如何利用声音识别技术连接用户的智能设备如手机,平板电脑等,从而为节目内容的延展阅读和赢得用户进行了深入交流。

聚拢用户

据流媒体网了解,Syntec TV主要是通过声音特征与数据库进行匹配得知用户正在收看的节目或频道。他们的两个主要方案,一个是针对实时直播节目,另一个是针对提前录制好的节目。同样录播节目针对视频网站的内容也适用。

Syntec TV针对电视信号的直播流,可将直播流实时采集录入其云服务,支持实时与直播内容关联,将直播内容与提前编辑好的第二屏内容进行互动;识别超过百家电视台电台播放的内容。对广告,使用的音乐,节目播放的频率和时间提供实时数据反馈。

录播(点播)方面,识别出已经录入系统的内容,通过第二屏可查看比如演员,剧情,花絮,采访,背景音乐等相关信息,影视资源等内容。

Syntec TV强调,此技术最大的好处是可以在较低的成本下进行台网内容聚合,将电视内容实现互联网端的二次营销和产品导入,从而提升品牌认知度和内容吸引力。。

当被问及是否牵涉到个人隐私时,Syntec TV表示,匹配的过程只是将没有语义的声纹特征传给后台服务器,后台在没有人工的干预下直接与数据库的数据作匹配然后得出结果,所以并不存在用户隐私被泄露的情况。

多屏互动方面,Syntec TV给出了哈萨克斯坦一个客户的案例。主持人出来后会,手机端自动识别相应的播放进度,提示对其的背景介绍,选手出来时,选手的信息也会实时显示在第二屏上,播放到问答环节时,第二屏也会同步显示问题,观众可同步参与答题,答对则有相应奖励。

 

 

 “对抗”微信

据流媒体网了解,Syntec TV从去年开始做相关的工作,微信摇电视火了之后,相关企业开始寻找并主动联系这个技术团队。

Syntec TV透漏,电视台及节目制作方曾找他们商谈“如何在节目有限时长内加入更有效的广告?”针对这个问题,Syntec TV提到把内容扩展到第二屏,通过识别用户观看的内容,精确推送节目里涉及的商品或一些相关内容来作为节目的补充和延展。对节目产生增值,因为电视上有时间限制,而在第二屏观众可以查看更多节目相关的信息。同时Syntec TV自信的认为,相比于微信,他们的技术会更灵活,因为微信摇一摇所有的操作都仅限于微信APP内的互动。Syntec TV还提到,比如前段时间热播的”我是歌手”是跟微信做的节目互动,但如果在电视台自己的应用内集成他们的技术,就可以直接在自己的APP里面做互动,将用户吸入自己的APP。

 

 

Syntec TV还说,“找到我们的一些客户,他们不仅想在直播里让用户互动,还想在他们把剧集或节目放在视频网站上以后,再次去看这些东西时依然能进行互动。这样的话就用的上我们这个技术,因为微信仅限于内容的首播。”

当流媒体网记者开玩笑的问微信会不会把Syntec TV碾压了时,他们坦言,其实Syntec TV跟微信并不是直接竞争的,微信是将摇一摇电视在微信中做,而Syntec TV的技术是将这个技术整合到第三方应用中。他们希望能帮助现有的一些APP或马上要做APP的电视台做成一个与节目和电视台互动延伸的服务。毕竟微信上的用户不是电视台自己的用户,Syntec TV就是帮他们实现这个愿望,让电视台通过Syntec TV的技术很准确地聚焦每个用户。

被问到识别的准确度和速度方面,Syntec TV告诉流媒体网,跟微信相比,两家的大规模测试是差不多的,都能准确识别节目。Syntec TV的识别速度分两种情况,一种是提前给他们音频,这种识别的速率大概是3-5S,而针对直播,大概是3-10S。

另据Syntec TV透露,目前团队正在开发一个云平台,会在近期上线,此云平台上线后有望使全球的客户更加简单方便的接入并使用Syntec TV的识别技术。

离线识别

目前Syntec TV也提供离线识别方面的技术方案,即使在不联网或网络堵塞的情况下也可以通过声音识别到相应的内容,从而触发用户在第二屏的互动。

愿Syntec TV真的能“拯救”电视台的互动!

ACRCloud接受36氪专访

Shazam 迈入十亿,“声音识别改造电视广告” 这事国内也有人做——Syntec TV

转载36Kr,作者:thethief

36kr

 

互联网和新媒体的发展对广告主而言毋庸置疑是好事,但对电视台来说却有点残酷。根据这几年的《中国广播电影电视发展报告》(又称广电蓝皮书),我们可以清晰地看到这几年广播电视广告收入的增幅逐年减小:

  • 2011年广播电视广告收入达 1122.90 亿元,同比增幅为 19%;
  • 2012年在全球广告市场萎靡的情况下,广播电视广告全年实现收入 1270.25 亿元,同比增幅降至 13.12%;
  • 2013年广播电视广告收入达到 1387.01 亿元,同比增长只有 9.21%,增速比上年又再下降 3.93 个百分点。

为什么电视广告的增速会放缓?就看电视的体验来说,传统的电视广告无法与受众有良好互动;就广告主投放广告的效果而言,在电视台投放广告既不精准又难以追踪;再加上越来越多人习惯通过网络收看电视节目,在一二线城市有较强消费能力的年轻人群中尤其如此。这些综合影响了广告主对电视广告的热情降低。

寻变的电视台和被寄予厚望的二维码

当然电视台们不会坐视情况变坏而无动于衷。一方面,由于电视台在内容制作上依然有着很大优势,而观众是跟着内容走的,所以我们能看到电视台们在和分销渠道(视频网站)合作时更为谨慎了。去年5月,湖南卫视在微博上宣布今后其拥有完整知识产权的自制节目,都将由芒果 TV 独播,在互联网版权上一律不分销,以此加速 “台网融合”。随后,央视更表示会独占 2014年 世界杯赛事直播权,我们在除 CNTV 外的任何网站都看不到世界杯直播。

 

Shazam 迈入十亿,“声音识别改造电视广告” 这事国内也有人做——Syntec TV

 

而另一方面,电视台开始想方设法对电视节目和电视广告的 “天然死穴” 进行改造。“通过二维码把用户带到第二屏互动” 是被寄予厚望的方式之一。最广为人知的例子依然是湖南卫视,它通过二维码把电视节目和官方出品的互动 App 呼啦连在了一起。但二维码也有弊端,由于屏闪的问题,老式电视可能无法扫描上;另外,扫描二维码有距离限制,舒服窝在沙发红酒配电视结果要爬起来走到电视前扫码,这对观众未免太残酷。

声音识别是比二维码更有效的方式

那有没有比二维码更好的互动入口呢?这两天刚宣布跻身 10 亿美元俱乐部的 Shazam给出的答案是声音识别。早期的 Shazam 主要帮助用户识别歌曲,而凭借这项技术,Shazam 在两年前踏足电视互动领域。通过识别电视广告并跳转到广告产品相关界面,进而引导用户了解更多产品详情甚至直接购买,这让电视广告和观众之间建立起了联系,电视广告也成为了 Shazam 最主要的吸金来源

而这次聊的 Syntec TV 团队,他们要做的事有点类似 Shazam,但产品是 To B 的。举个例子,如果淘宝成为了他们的客户,Syntec TV 会向淘宝提供一个 SDK,淘宝可以直接把它嵌入到淘宝客户端内。这样,当观众在电视上看到一个淘宝的广告时,根据提示打开手机的淘宝客户端,客户端通过声音识别出该广告后跳转到相应的页面,用户便可以查看活动详情或者直接进行游戏、互动甚至购买。

比起二维码,通过声音识别电视内容的技术难度更高,但对观众而言操作成本降低了不少。用户不需要爬起来走到电视前扫码,这对于窝在沙发里的电视观众们来说是极大的成本降低。另外,对电视节目来说,节目进行到不同时刻可能会引导用户进行不同的互动,声音识别技术可以识别节目进行到什么阶段,从而实时地电视直播内容和第二屏互动内容关联起来。

Syntec TV 团队提到,如果愿意,其实可以把产品做成一直在后台保持运行的状态,这样当用户在电视上看到有和 Syntec TV 合作的品牌的广告时,手机就会自动收到相应客户端的提示。但鉴于可能对用户造成严重的打扰,这个功能目前还没有做到产品里去。

引爆者可能是微信摇一摇

那国内有没有类似的通过声音识别电视节目的产品呢?Syntec TV 表示,国内做电视第二屏互动的不少,但通过声音识别技术来实现的,据他们所知寥寥无几。有一个大家都很熟悉的产品不仅做了,而且还和电视台们有过不少合作了,这个产品名叫微信。有关注去年的 “中国好声音” 的话,可能你还记得当时的 “摇一摇参与竞猜”。通过摇一摇识别电视中正在播放的声音,观众可以直接转到一个互动页面参与竞猜。Syntec TV 团队的人向 36 氪透露,据他们所知,微信现在正 “花大力气” 做这个事,也许在 2015 的大年三十,我们就能看到微信摇一摇和央视春晚的合作。而毕竟微信不会将这个功能开放给其他客户端,所以微信的加入对 Syntec TV 来说也是好事,能够起到很好的 “教育” 作用。

 

Shazam 迈入十亿,“声音识别改造电视广告” 这事国内也有人做——Syntec TV

 

无论 Syntec TV 能为电视广告的 “自救” 带来多大的效果,通过声音识别将受众转移到第二屏进行互动,这个方案在未来还是有更多应用场景的。比如柯南的电影版完全可以在片头引导用户识别声音进入到互动界面,竞猜一下凶手到底是谁。或者配合电影提供一个解谜类的游戏给用户玩耍,甚至可以配合电影院现场的座位和布置,将一部电影变成一个从荧幕到真实世界都联动起来的互动娱乐。

另外,声音识别领域的标杆 Shazam 在最新一轮融资中讲出的故事是 “连接人们周围的世界”(Our vision is to connect people to the world around them),这对 Syntec TV 来说也许也是具有借鉴意义的思路。