2023年12月14日
生成AIの回答精度を向上させる独自のデータ整形技術を開発
生成AIに整形したデータを活用することで誤回答を約90%削減
大日本印刷株式会社(本社:東京 代表取締役社長:北島義斉 以下:DNP)は、PDF、Word等の多様なドキュメントを生成AIの学習に適したデータ形式に整形する技術を開発しました。本技術で整形したデータを生成AIが学習・参照することで、誤回答や非回答の件数を減らし、高い精度での回答を実現します。
DNPは2023年5月に生成AIを活用できる社内環境を構築*1しています。今回、本技術を用いて、社内規定、品質マニュアル、決算短信などのドキュメントのデータを整形し、生成AIに学習・参照させて実証実験を行いました。その結果、整形したデータを用いた生成AIは、従来の生成AIと比較して、誤回答を約90%削減することができました。
この技術を活用した生成AIを利用することで、膨大なマニュアルやドキュメントを参照して業務を行う審査やコンタクトセンターの問い合わせ対応において、高精度な回答につながり、業務効率化を実現します。
整形データを学習していない生成AI(左下)と学習した生成AI(右下)との回答例の比較
【生成AI向けデータ整形技術開発の背景】
急速に普及が進む生成AIが抱える課題に、回答精度の低さがあります。その解決策の一つとして、外部から正しい知識・情報・データを与えることが有効とされています。日本政府は、生成AIの利用ルール等を議論する「AI戦略会議」で、政府保有のデータを開発者に提供する方針を決めていますが、その多くはPDF形式であり、生成AIが効果的に学習・参照できるような構造に情報を整形する必要があります。こうした課題の解決に向けてDNPは今回、企業・自治体等が保有する多様なドキュメントを生成AI向けのデータとして整形する技術を開発しました。
【DNPが開発した独自の生成AI向けデータ整形技術の特長】
DNPは独自の「P&I(印刷と情報)」の強みを掛け合わせ、企業・団体等の申込受付やコンタクトセンター等の幅広い業務を代行するBPO事業や、印刷プロセスで培った各種情報加工、文字・画像処理等の技術・ノウハウを保有しています。これらの強みを活かし、本技術を開発しています。
○本技術は、テキスト・画像・表組等が混在したドキュメントから、独自のAIモデルを使ってタイトルや本文、画像や表の内容・キャプションなどの要素ごとにコンテンツを分割し*2、生成AIが学習・参照しやすいデータ形式に整形します。データ整形は人手をほぼ介さずに機械処理で行うため、大量の文書も高速に処理できます。
○より複雑で異なるレイアウトやドキュメントに対応するためには、ドキュメントの構造を認識する継続したAIモデルの拡充が重要です。DNPが開発したAIモデルは、一般的なディープラーニング(深層学習)のモデルでは数百~数千ページのデータ学習が必要となるところ、数十ページのデータ学習で生成AI向けのデータを整形することができます。
生成AIの回答精度を高めるDNPのデータ整形技術の概要イメージ
【今後の展開】
DNPは2024年1月に、生成AIの導入や活用、生成AIに必要な学習データの加工・収集に課題を持つ企業・団体に向けて、本技術を提供します。また、契約書・帳票類・業務マニュアル等、膨大なドキュメントを取り扱う自治体や金融機関に、生成AIを活用して業務のデジタルトランスフォーメーション(DX)につなげるサービスを開発し、企業・団体の業務改革の実現を目指します。
*1 生成AIを活用できる環境を構築 → https://www.dnp.co.jp/news/detail/20169392_1587.html
*2 特許取得済
※記載されている会社名・商品名は、各社の商標または登録商標です。
※ニュースリリースに記載された製品の仕様、サービス内容などは発表日現在のものです。その後予告なしに変更されることがありますので、あらかじめご了承ください。
- X(旧Twitter)にポスト(別ウインドウで開く)
- メール
- URLをコピー
- 印刷
- 発表時期
-
- 注目のトレンドタグ
- カテゴリ
-