特集
» 2021年08月03日 10時00分 公開

議事録作成に使えるか、Googleの音声認識の精度を辛口で検証してみた

[Users Digital]

本記事は2021年6月27日の「Users Digital」掲載記事をキーマンズネット編集部が一部編集の上、転載したものです。

はじめに

 オンラインを前提とした働き方が広く普及し、私たちの生活様式もだいぶ様変わりしてきました。業務のオンライン化を実現するさまざまな手段のうち、Google Workspaceに関して多くの情報を発信しておりますが、今回は議事録作成にも役立つ音声入力について、その機能や実際に動かしてみた様子、精度をお伝えしたいと思います。筆者自身が書き起こす場合と比較もしています。Googleの音声入力は業務利用に耐え得るものなのでしょうか。

音声入力はどういった使い方ができる?

 音声入力は議事録作成や、ライティング、そして放送業界でいうキャプションなどの領域で脚光を浴びており、さらにはコールセンターなどにおける情報分析やデータ活用でも注目されています。

 音声データは膨大にあるものの、音声のままだと扱いにくく、分析もしづらいので、テキスト化して扱いやすくするという理由があるそうです。

音声入力で文章を起こしてみる

 少し余談を挟みましたが、早速音声から文章を起こしてみたいと思います。

まずは音声入力に使う文章を用意する

 何を音声入力にインプットすべきか。ですが、今回はBFTが運用するオウンドメディアUsersDigitalのメディア紹介記事である『「UsersDigital」とは?』に書いている内容を一部抜粋しました。今回はこの文章を使って試してみたいと思います。

 DX推進、デジタルシフトの重要性が叫ばれる中、日本はしばしばデジタル化が遅れている。DXが進んでいない。と指摘されるようになりました。必ずしもその指摘が正しいとは限りませんが、諸外国に比べ、劣後してしまっている感は否めません。日本社会のITに対する考え方やIT産業の構造の影響もあり、企業のIT部門は少ない人数で多くの仕事を抱える必要があるようにも思えます。そうした環境下では、デジタル化やDX推進はIT部門が考えるべきだ。と言う話も無理のある話ではないかと思います。最も、DXそのものが「自らを、自らのビジネスを変革させる」ことだとすれば、なおさらIT部門だけが担うべき性質のものではないことは明白ではないでしょうか。

出典:UsersDigital『「UsersDigital」とは?』,https://www.users-digital.com/about/,(2021/07/30)

自分で話すのは気が引けるので、Amazon PollyのTakumiさんの声を借用する

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。