山野のページ

所属:法政大学大学院 情報科学研究科 修士課程2年 伊藤研究室
研究テーマ:ライフログ(特に音から得られる情報について)


<研究テーマについて少し詳しく>
ライフログ(Life-log)とは個人の生活や行動の記録です。
具体的には常時記録された映像情報、音響情報、位置情報、加速度、脳波、脈拍、
文書、メール、ウェブページの閲覧履歴など様々な情報がライフログとして扱われます。

これらの情報を利用することで、生活、行動の支援となるようなシステムが開発できると期待されています。
例えば、

・常時記録された映像を備忘録として活用
・映像や位置情報を用いて1日の行動履歴を作成し蓄積して、日記として残す
・得られた情報から個人の行動パターンを解析し、必要とされるサービスを自動で提供する

など様々な利用法が考えられます。

このような利用法から考えるとライフログ映像から得られる情報はとても多いのですが、常時記録されるためデータ量が膨大かつ冗長です。
したがって、ライフログ映像を効率良く扱うには、データを整理するためのインデキシングや、検索のためのタグを付けることが必要になってきます。
また、インデキシングのためにはインデックスを付加するシーンの検出が必要になります。
映像のシーン分割は映像情報を用いて行われることが多いですが、ライフログ映像の場合不十分な場合があります。
私はそのような場合に音響情報を用いてシーン分割を行うための研究を行っていました(詳しくは下記文献[1][2][3]参照)。

現在は、ウェアラブルマイクで常時記録した音響情報(音響ライフログ)について研究をしています。
音響ライフログも非常に冗長で、インデキシング、クラスタリングなどが必要です。
そこで、音響ライフログをセグメントに分割し、それらのクラスタリングをする手法について研究をしています。
現状はクラスタリングに有効な特徴量の探索実験をしています。


<発表論文リスト>
[1] 山野 貴一郎, 伊藤 克亘, "スペクトル情報を用いたライフログ映像のシーン検出", 第2回音声ドキュメント処理ワークショップ(2008/2), 原稿(pdf)

[2] K.Yamano, K.Itou, "Detecting Scenes in Lifelog Videos based on Probabilistic Models of Audio data", Acoustics08(2008/7), 原稿(pdf)

[3] 山野 貴一郎, 伊藤 克亘, "バイノーラルマイクを用いたライフログ映像のショット識別", 電子情報通信学会,第23回信号処理シンポジウム(2008/11), 原稿(pdf)

[4] 山野 貴一郎, 伊藤 克亘, "音響情報を用いたライフログデータのクラスタリング", 第3回音声ドキュメント処理ワークショップ(2009/2), 原稿(pdf)

[5] 山野 貴一郎, 伊藤 克亘, "音響情報を用いたライフログデータのインデキシング", 第71回情報処理学会全国大会(2009/3), 原稿(pdf)

[6] 山野 貴一郎, 伊藤 克亘, "音響情報と位置情報を用いたライフログデータのクラスタリング", DICOMO2009(2009/7), 原稿(pdf)

[7] K.Yamano, K.Itou, "Browsing Audio Life-log Data Using Acoustic and Location Information", UBICOMM2009(2009/10), 原稿(pdf)