ポッドキャストを全文検索

これはちょっとすごいですよ?

昨年12月にリリースされたサービスですが、ポッドキャストを音声認識ソフトでテキストに変換、それを検索できる検索エンジンです。海外ではすでにいくつかのサービスがあるようですが(※)、日本語では初。やはり日本語の音声認識は同音異義語などもあって難しいようです。

そこでWikiですよ。

このシステムでは、誤認識された部分をみんなで訂正するという手法を取っています。それによって、音声認識システムそのものも学習して成長していきます。まさに集合知。Web2.0の世界。

実際に使ってみた感じでは、まだ登録されているポッドキャストが少ないことと、
訂正する際に同音異義語などをどう直せばいいか迷うことがあります(聴くor聞く、アラビア数字or漢数字、口語で冒頭にでる「えー」とか「んー」とか)。こういうのはガイドラインが必要になったりするのかな。
また、ポッドキャストだから(検索に引っかからないから)言えてたことっていうのもあると思います。そうなると発言に気をつけることになっちゃったり、おいらのポッドキャストは登録しないでくれよ、っていうことになっちゃったり。。。

いろいろと課題はあると思いますが、なんとなくワクワクさせてくれます。今後の発展が面白そうなサービスであることは間違いないです。

PodZinger(YouTubeにも対応)、PodScopeYahoo音声検索っていうのもあったけど、画像検索と同じでファイル名や周りのテキストから推測してるだけだったorz.

コメントを残す