科技食谱

AI,莫扎特的新时代

如果您只能听到音乐播放并隔离特定乐器的声音怎么办?计算机科学与人工智能实验室(CSAIL)是麻省理工学院的计算机科学与人工智能研究所,它开发了PixelPlayer,这是一种只能提取某些乐器声音的人工智能系统。

这个产品不只是通过听声音来拾取声音。像素播放器在像素级别识别视频中可见的乐器。然后提取该乐器的声音。无需任何人为干预即可同时同步视频和音乐。然后,您可以将您的声音与视频中正在播放的人员关联,只需单击视频即可删除特定乐器的声音,或者为每个乐器单独调节音量。

如果您查看来自CSAIL的示例视频,并且您只想听到弹奏吉他和小提琴的二重奏的吉他,请单击弹吉他的人。这只会提取吉他声音。用小号和大号演奏的图像也是如此。其他乐器可以减少或完全消除,只有喇叭声可以提高。

(在视频上方使用像素播放器)

像素播放器可以通过深度学习技术分析超过60小时的视频播放,以识别20多种乐器声音。当然,如上所述,这些仪器中的每一个都可以自由地调节音量。当然,乐器提取的音质仍然不同,但是如果有更多的学习数据,可以增加可以辨别的乐器数量和质量。 CSAIL表示它将很快发布像素播放器数据集和代码。

像素播放器在哪里可以使用?它可以应用于调整过去的性能视频的音质或音量,以便可以轻松调整并区分环境噪声。

人工智能领域也不例外。将人工智能融入艺术领域(如音乐)的尝试仍在继续。

索尼计算机科学研究所(Sony CSL)于2016年使用人工智能从YouTube发布了两首歌曲。使用名为Flow Machines的人工智能软件,学生通过大量音乐数据学习音乐风格。人工智能从大量数据中学习音乐风格,然后将它们组合成自己的作品。

通过此过程处理的歌曲是通过在名为LSDB的数据库中记录超过10,000首歌曲来编写的。例如,如果你击中歌手,你可以选择甲壳虫乐队的风格。实际研究人员发布的音乐是由作曲家和作曲家组成和编曲的作曲家组成的,但却引起了人们的极大关注。

Deepjazz是一款自动爵士乐发生器,是国内程序员在2016年36小时内用黑客音调制作的。使用Python,深度学习库Keras和Theano用于通过MIDI文件在中长记忆短期记忆(LSTM)中编写爵士乐。组成爵士乐的人工智能。

2016年,华盛顿大学的研究人员分析了古典音乐并发布了一个名为MusicNet的庞大数据集。它分析了330个免费音乐源,并成功地微调了所有播放的音高,声音和时间。据说在此过程中收集了超过一百万个声音数据。在这个过程之后,我们可以说数据是基于实际的声音。最后,这些数据集也是通过将音乐融入人工智能来重建音乐的一部分。这种分析当然可以帮助您更好地理解您已经创作的音乐。到目前为止,如果您根据人的耳朵或手的工作自动处理数据,理解音乐本身的过程可能会发生变化。

正如我们在像素播放器的例子中所看到的,它不仅仅是数据识别对象中的音乐。同年,多伦多大学研究所宣布了一种人工智能,只用一张圣诞树的照片识别图像,并根据它们生成音乐。基于超过100小时的在线音乐,使用神经网络的人工智能创造了每分钟120比特的旋律,并为和弦添加了鼓声。它引起了人们的注意,因为它从作品的完美中识别出图像,并产生与大气相匹配的音乐。

您不仅可以识别图像或视频,分析和分类音乐本身,创建数据,甚至创建新的声音。谷歌的NSynth Super于3月发布,是一款合成器,可以通过机器学习产生完全不同的声音。它是一个只有20厘米宽度和高度的小产品,但它包含大量数据。它结合了长笛和军鼓功能,创造出新的声音。已经开发出符合音乐的人工智能。

lswcap

lswcap

通过每月的AHC PC和HowPC杂志时代,他在网络IT媒体上观看了“技术时代”,如ZDNet,电子报互联网经理,Consumer Journal Ivers的编辑,TechHolic出版商和Venture Square的编辑。 我很好奇这个仍然充满活力的市场。

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

%d 블로거가 이것을 좋아합니다: