新技術:富士通研究所、精度に優れたテキスト領域抽出技術を開発

この記事をtweetする このエントリーをはてなブックマークに追加


新技術:富士通研究所、精度に優れたテキスト領域抽出技術を開発


掲載日:2006/01/30


News

 株式会社富士通研究所は、JPEG形式で圧縮し画像劣化したカラー文書画像や、さまざまな色使いが用いられたカラー文書画像から、優れた精度でテキストの含まれる領域を抽出するハイブリッド型テキスト領域抽出技術を、開発した。

 今回開発された技術は、テキストパターン抽出処理と図表パターン抽出処理を相補的に組み合わせることで、優れた精度でのテキスト領域抽出が可能となっている。テキストパターン抽出処理では、カラー画像の色変化が大きい部分を検出して文字輪郭領域を推定することで、文字色を適応的に判定してテキストパターンを抽出する。これにより、さまざまな色使いのレイアウトに対応可能となるほか、文字輪郭領域以外からの色むらノイズの発生を防ぎ、テキスト領域を精密に抽出することができる。

 図表パターン抽出処理では、罫線やレイアウト上の区切り線(セパレータ)の連結性を考慮して抽出することで、罫線やセパレータを優れた精度で抽出し、罫線やセパレータに囲まれたテキストパターンの含まれる領域候補を絞り込むことができる。同技術は今後、同社スキャナ製品に搭載し、提供される予定。


出荷日・発売日 −−−
価格 −−−

関連キーワード

  ※製品ニュースに関するお問合せ : 企業サイトへ


  ※関連キーワードのリンクは自動で行っているため、適切でない可能性があります。ご了承ください。


図解でわかりやすいIT技術の解説記事2000本
ITセミナー400件、IT製品情報1000件以上!

キーマンズネットは、アイティメディア株式会社が運営する「企業向けIT関連情報サービス」です。会社で導入するIT関連製品の検討・選定にお役立ていただける情報サービスです。情報量・登録料ともに無料です。安心してご利用下さい。

「オフィス機器」関連 製品レポート一覧

このページの先頭へ


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


掲載されておりますサービス内容・料金などは掲載日時点のものです。変更となる場合がございますのでご了承下さい。


20013298


IT・IT製品TOP > オフィス機器 > 複合機 > 複合機のITニュース > ニュース詳細

このページの先頭へ

キーマンズネットとは

ページトップへ