プロジェクト名

Webインテリジェンス

メンバー

湯浅,丹羽(2013)

佐野,湯浅,丹羽(2012)

キーワード

Webページ分割,Webエージェント,Web情報構造化

目的

Web情報の再利用性を向上させるために,閲覧者の観点からWeb情報の構造化を行う.

概要

Web情報は意味的な構造を持たないテキストであり,計算機を用いて情報の統合や検索をするためには多くの課題を解決する必要がある. 本研究では既存のWeb情報を閲覧者の観点から構造化し,効果的な情報閲覧を支援するための技術を提案する. 提案手法ではWebページのレイアウト情報を基にWebページ分割を行い,Web情報の構造化を試みる. 分割した結果得られる単位をWebブロックと呼ぶ. Webブロック管理機構を実装し,その有用性を実証する. 本研究の成果は,Webページから特定のWebコンテンツを高い精度で収集可能にする. また,既存のWebコンテンツの再利用性を向上させる.

本プロジェクトの研究成果として,Web閲覧者から分割事例を収集するためのWebエージェントを実装した. また,得られたデータを整理し閲覧者の観点を調査することで,タイトルブロックに着目したWebページ分割手法を提案した. 提案手法では,Webページを細分化ブロックという単位まで分割した後に, Webコンテンツの見出しとなるようなブロック(タイトルブロック)に着目して細分化ブロックの結合を行うことにより, Webページを意味的にまとまりのある単位へと分割する.


Copyright (c) 2012-2013 Shintani Lab. All rights reserved.