■ 日本出版学会 出版教育研究部会/出版デジタル研究部会共催
開催要旨 (2019年3月2日開催)
「ビッグデータを用いた「言葉」の分析と、
AI(人工知能)を用いた編集・執筆支援システムの将来」
報告者:酒井 信(文教大学准教授)
池上俊介(データセクション株式会社、
慶應義塾大学SFC研究所訪問研究員)
AI(人工知能)と呼ばれる技術の根幹は、自然言語処理にあり、本来的に同じく活字を扱う出版産業との親和性が高い。大量の文章を解析にかけ、埋没した知見を抽出する自然言語処理の技術を用いて、著者や編集者の編集や校閲の作業や、執筆を支援するシステムが様々な形で開発されている。
報告者(酒井信)は文教大学情報学部の准教授で、文芸誌や論壇誌に批評文を執筆する傍ら、前任先の慶應義塾大学グローバルセキュリティ研究所時代から、自然言語処理の技術を用いたニュースの解析と分析の研究に関わってきた。
報告者(池上俊介)は、慶應義塾大学総合政策学部で自然言語処理を専門として学び、ビッグデータの解析を専門とするデータセクション株式会社でCEO等の役職を務め、長期にわたって自然言語解析の技術開発に携わり、様々な業種・分野にこの技術を普及させてきた。
本報告では将来にわたり、自然言語処理の技術を、どのような形で文章の執筆や編集、校閲の支援に役立てることができるのか、現代的な事例を基にして報告と議論を行った。
報告者は先ずビッグデータの解析について、スマホやソーシャルメディア、YouTube、生体データ、POSなど多様なデータが日々記録されるようになった歴史(30年ほど)に重点を置いた説明を行った。有名なエピソードとして、POSデータを活用した購買行動の解析や、球団運営にデータ解析を活用した事例(映画『マネーボール』などを参照)、元米大統領のオバマ氏が行った政治マーケティング(「マネーボールキャンペーン」)を紹介した。
その上で、スポーツや金融、天気などの定形データと文章をセットでAIに学習させることで、データを説明する記事を自動作成する「AI記者」の使用事例について説明した。例えば米ワシントン・ポスト紙では、リオ・オリンピックの際に「AI記者」を導入し、競技速報の単純作業をAIに代行させることで、人間の記者がインタビューなどの記事に専念する環境を整えている。
データセクション株式会社でも中部経済新聞の創刊70周年特別企画で「この記事、AI記者が書きました」という記事を発表した。またアイドルのTwitterの投稿を代行するシステムを開発・導入してきた。ビッグデータの解析の技術にはまだまだ改善の余地があるが、過去の記事とデータを大量に準備しAIに機械学習させることで、新たなデータを使って過去の似たパターンから連続する単語を組み合わせて、文章の作成を行うことができる。
また文章作成をAIを用いてサポートするシステムは応用範囲が広い。スポーツ、選挙、金融、天気予報、キャッチコピーのような文章の形式が安定した分野で、AI記者が活躍することが期待される。その一方で人間の記者や書き手は、人間にしかできない文章の作成に注力することができるため、文章をメディア文化の発展に促すことができる。マネタイズに苦しむメディアは、AIを用い、コンテンツの制作効率を上げることで、新たな時代の生き残りを模索する必要がある。
参加者: 48名(会員15名、一般10名、学生23名)
会 場: 専修大学神田キャンパス5号館542教室
(文責:酒井 信)