音声認識を用いた自動字幕作成システム
Captioning System based on Automatic Speech Recognition Technology
KU Logo
京都大学 河原研究室
最終更新: 2017/01/10
概要

本システムは,話し言葉の音声認識技術を用いて,映像や音声から自動的に字幕(の草稿)を作成するものです.現在のところ,対象として学術講演・講義や討論のコンテンツを想定しています.

作成された字幕は,字幕用に設計された本システムのエディタで,オンライン・オフラインで編集することができます.エディタはJavaで実装されているため,様々なプラットフォームで実行できます.

使い方

本システムの使い方については次のマニュアル(PDF)をご覧下さい.

字幕作成には以下のリンクからお進み下さい.

  • 通常モード
    音声認識で書き起こして字幕を作成します.
  • 同期限定モード
    すでに書き起こしがある場合に,音声と文を時間同期します.

エディタをオフラインでご利用の場合は,次のキットをダウンロードして下さい.

注意事項

本システムは,次の点を理解・同意した上でご利用下さい.データの登録時に同意を求められます.

  • 本システムの機能と完全性
    本システムは音声認識を含む音声言語処理技術を用いて自動的に字幕を作成します. これらの技術は必ずしも完全なものではなく,特に音声認識技術は発話内容を全て正確に書き起こせるものではありません. 音声の品質が悪い,音声の話題が特殊であるといった場合は特に誤りが多くなるか,処理に失敗することもあります.なお,本システムでは音質をチェックしており,一定以下の品質の場合は認識を実行せずエラーとなります.
  • 機密情報と個人情報
    本システムには,形式のいかんにかかわらず,公開すべきではない機密情報・個人情報を登録しないでください.作成された字幕についてアクセス制限は行われないため,これらの情報が意図しない第三者によりアクセスされる可能性があります.
  • プライバシーポリシー
    京都大学河原研究室(以下,河原研究室)は,本システムにより字幕を作成しようとする者(以下,利用者)が本システムに登録した音声・映像・テキスト等のデータ(以下,登録データ)を収集・蓄積して,学術研究目的に使用します.登録データは学術研究目的以外には使用しません.この目的の範囲内で,共同で研究を実施する機関・研究者等(以下,共同研究者)に登録データを提供することがあります.これ以外の組織・個人には登録データを提供しません.河原研究室および共同研究者は,学術発表のために登録データを口頭発表・論文等で公開することがありますが,利用者が特定できないように努めます.
  • 本システム運用者の責任
    河原研究室は,本システムにより作成された字幕について,一切の責任を負いません.なお,河原研究室の判断により,登録データの削除,作成された字幕の公開停止や削除が行われることがあります.登録データおよび字幕について,利用者からの削除・修正等の要求には,原則として応じません.
学術発表
報道発表

これまでに以下の学術発表を行っています.

  • 河原達也, 秋田祐哉, 広瀬洋子.
    「自動音声認識を用いた放送大学のオンライン授業に対する字幕付与」
    情報処理学会研究報告 AAC-2-5, 2016. (予稿)
  • 秋田祐哉, 三村正人, 河原達也.
    「音声認識を用いた講義・講演の字幕作成・編集システム」
    情報処理学会研究報告 SLP-108-2, 2015. (情報処理学会電子図書館)

これまでに以下の報道発表を行っています.


問い合わせ先: 京都大学 河原研究室
captionsap.ist.i.kyoto-u.ac.jp
(メールアドレスの一部は画像です)