音声インデクシング技術
プロが現場で構築するLinuxサーバー技術が習得できる講座とセミナー
→ 【Linux講座】リナックスマスター・ホームスタディ講座
→ 【Linuxセミナー】リナックスマスタープロセミナー【2日間集中研修】
スポンサードリンク
音声インデクシング技術
音声インデクシング技術のもっと詳しい説明はこちらをクリックしてください。
今回のテーマは「音声インデクシング技術」。音声認識、自然言語処理技術を使い、音声や動画を含む映像コンテンツの内容を示す「メタデータ」を高精度に付与する技術です。今後ますますニーズが高まる、ネットワーク上での映像コンテンツの流通のキーとなる技術として期待されています。
映像に含まれている音声データから、話されている内容をテキスト化すると同時に、XMLによるメタデータ化を全自動で行なうことで、映像コンテンツの一覧性や検索性を高める技術のこと。メタデータとは、「コンテンツに関するデータ」であり、コンテンツに対してさまざまな観点から情報が付与される。
音声インデクシング技術とは
メディアのタイプ、データサイズ、最終更新日などの形式的な情報から、本質的なコンテンツの意味内容に関する情報はもちろんのこと、著作権や利用条件などにかかわる付帯情報なども含まれる。こうしたメタデータを適切にコンテンツに付与する作業は、これまで人手に頼るところが多く、それを効率化する技術が求められてきた。
高度なコンピュータ処理を駆使した音声インデクシング技術により、音声や画像といった「ディジタル信号」から、メタデータという「内容を記述したデータ」を自動的に作成することが可能になるのだ。
コンテンツのメタデータの自動生成を、テレビニュース映像を例に説明する。ニュース映像のコンテンツを再生(読み込み)させると、リアルタイムで話されている言葉が次々とテキストとなって画面に現れる。一通り映像の読み込みが終わると、ニュース映像がストーリー(ニュース項目)ごとに一覧表示される。表示内容は、ストーリーの要約、ジャンル分類、ストーリーに含まれるキーワードリンク、それに代表的な映像場面をクリップしたサムネイル画像だ。ユーザーは表示されたサムネイル画像やキーワードリンクをクリックすることにより、目的のニュースストーリーを指定して再生することができるのだ。
インターネットの普及によりネットワーク経由で映像コンテンツを閲覧することが容易になっている現在、無限に近い広がりを見せるインターネット中のいったいどこに有用な映像コンテンツがあるのかを見つけ出すためのキーとなるのが映像情報のメタデータ化だ。この処理が自動化されることで、より幅広い映像コンテンツの活用が可能となる。
CenOSのサーバー構築手順、VMware Playerの
ダウンロードとインストール手順をまとめたマニュアルを
無料でプレゼントしています。
詳しくは↓のページで説明しています。今すぐクリックしてダウンロードしてください。
CentOSサーバー構築無料マニュアル
スポンサードリンク
Linux初心者のあなたもサーバー管理者になれる
Linux初心者のあなたもサーバー管理者になれる!!
UNIX/Linuxコマンド Topicsでは初心者からでも気軽にLinux(リナックス)を、はじめられる方法を紹介しています。このサイトのいちばんの目的は、あなたにLinux(リナックス)を、はじめてもらうことです。 興味があるならサーバー構築してみてください。
このサイトについて、、、。まずは私の想いを知ってください。あなたに一番最初に読んで欲しい
UNIX/Linuxコマンド Topics Linux初心者のためのサイト:当サイトについて
- UNIX/Linuxコマンド Topics Linux初心者のためのサイトは個人で運営しているサイトです。
- ご意見、ご質問はメールでお願いいたします。