日刊サンWEB|ニュース・求人・不動産・美容・健康・教育まで、ハワイで役立つ最新情報がいつでも読めます

ハワイに住む人の情報源といえば日刊サン。ハワイで暮らす方に役立つ情報が満載の情報サイト。ニュース、求人・仕事探し、住まい、子どもの教育、毎日の行事・イベント、美容・健康、車、終活のことまで幅広く網羅しています。

デジタル版・新聞

ちょっと役立つ 日本の新製品

【ちょっと役立つ 日本の新製品】生成AIとは?

ChatGPTをはじめとする「生成型のAI」が飛躍的な進化を遂げて、今や、「生成AIと呼ばれ、日常生活や色々なビジネス場面で広く使用されています。画像や音声、テキストなどのコンテンツを生成し、業務の効率化やアイデアの創出などを行なっています。ここでは、生成型AIとは何か、どんなものがあるのか、使い方は?、出来ること・出来ないことはなにか、今後の課題はなにか、を概説します。

1. そもそも、「人工知能AI」とはなにか? (「生成型」とは何か? の、前に)

人間の脳で行なっている知的作業をコンピュータ内に模倣して構築し、英語や日本語を理解したり、論理的推測や経験に基づき学習を行ったりする仕組みを人工知能AIと呼びます。人間や生物の自然な知能活動に対比し、人工的に作り出したものですが、そこには自立性と適応性があることが特徴です。即ち、人間が指示を出さなくても作業を遂行できる能力を有し、更に、学習や経験した内容を基に知的能力を自力で改善向上できる能力を備えています。人工知能AIには高度な技術分野が多く関わっていますので、ここで簡単におさらいをしておきます。

まず、人工知能の研究は、人間の思考過程を記号で表現し、問題解決のパターンをケース分けして目的となる条件を探し出すという知識の探索の研究が始められ、そして、知識間の関係の推論技術に挑戦しました。「明確なルールが存在する問題(パズルや簡単なゲーム)」では高い性能を発揮しましたが、現実的で複雑な問題は解けませんでした。しかし、この段階での大きな成果の一つが、人とコンピュータが会話するという人工対話システムが発達したことでした。予め決められたシナリオ/プランに従って、例えば、人間がシステムに「お腹が痛い」と言えば、システムは「なぜお腹が痛いのか?」と返答するのです。パターン以外の会話はできませんが、限られた範囲での対話が可能になりました。その後、対話システムや検索・推論システムに、色々な分野の「知識」を埋め込むことが考えられ、専門分野の知識についての質問に答えられるようになりました。「エキスパートシステム」の研究です。知識表現、検索などの技術がプログラムに加えられ、条件に応じた答えを返す「適切に回答する専門家」の役割を果たすようになったのです。医療や生産、金融、人事、会計などの分野でエキスパートシステムが多く作られ、大企業の多くが日常業務に活用したのです。しかし、曖昧な事例に対しては、適切な判断を下す事で出来ないため、例えば、医療分野では「体がだるい」などの曖昧な情報だけでは、患者にどのような症状・病気の可能性が有るのかという正確な回答は出せませんでした。単純な例としては、家電を制御するプログラムや音声認識, 顔認証、掃除ロボットなどがあります。

予め予想した問題解決はともかく、新規な問題や曖昧な問題、予想外の条件発生などに対するための、よりフレキシブルな振る舞いを持つ技術が要求されるようになりました。それから現在に至る期間では、「機械学習」が盛んに研究されてきました。AIが自ら学習していく仕組みのことです。過去のデータを読み込ませることによってAIが学習し、得た学習データに基づいて新たな予測・推論を行なっていくことが可能になったのです。また、この機械学習に加えて、獲得データが持つ色々な特徴を捉え、その度合い量を自動的に抽出するという「深層学習=ディープラーニング」も実用化されるようになり、学習能力が大きく進化しました。たとえば、これまで「りんご」を認識させるためには、「赤い」、「丸い」といった特徴を人間が教える必要がありましたが、この深層学習では、コンピュータが自動的に特徴を分類した上で、人間では識別できない特徴やそれの度合い量を形成できるようになったのです。つまり、人間が1からリンゴの特徴を教えなくても、機械が自らリンゴの特徴を把握できるようになったのです。赤いリンゴだけでなく、青リンゴや黄色いりんごなども理解できるのは、大きな進歩と言えます。

2. 人工知能AIの重要な機能と活用例は?

2.1 重要な要素技術:

AIの機能には、「画像認識」、「音声認識」、「自然言語処理」、「予測・異常検知」などがあり、それぞれが個別に、あるいは、組み合わされて活用されています。画像認識は、画像に写っている人・物の判別を行い、防犯カメラの映像チェックや工場における不良品の検知などに活用されています。音声認識は、人間の音声のテキスト化・処理を行います。会話型AIによるコールセンター対応や会議議事録の作成、自動翻訳、スマートフォンなどのAIアシスタントなどがあります。自然言語処理では、人間ユーザが入力したテキストの変換・処理を行い、文字入力変換、ウエブ検索エンジンの運用、機械翻訳、ビッグデータの活用などが関わる。最後に、予測・異常検知能力は、過去のデータに基づいて将来的な予測を行ったり、外れ値・変化点などの検出による異常検知を行います。商品の需要予測や製造業における設備・製品の異常検知、メールやチャットのスパム検知などに活用されています。

つまり、金融機関の本人確認、株価予測、機械翻訳、AIスピーカ、掃除ロボット、農業・畜産業、製造業、金融業、自治体、交通、観光・旅行、小売・飲食・サービス業、不動産業界、医療・ヘルスケアなど、活用分野を大きく広げています。

2.2 人工知能AIの仕組みと基本的要素をなにか?

  人工知能AIには、機械学習、ニューラルネットワーク、ディープラーニング(深層学習)という3つの要素が基本としてあります。

(1)機械学習:

これは、大量のデータをもとに、人工知能AIが自ら学習して、予測や分類の作業を実行するモデル・アルゴリズムを自動的に形成する技術を指します。この方法には、「教師あり学習」、「教師なし学習」、「強化学習」があります。

「教師あり学習」:ラベル(正解の情報)が付与されたデータを使って機械に学習させる方法で、データセット(標本データ)に基づいた予測モデルを形成する。

「教師なし学習」:ラベルを付与していないデータを使って学習させる方法で、データセットの規則性や類似性に基づいて機械が予測モデルを形成する。

「強化学習」:目的として設定した「(評価点)スコア」を最大化できるように、機械に自ら試行錯誤しながら学習させる方法。

これらの機械学習は、画像に写っている人物の顔を判別する認証機能や、過去のデータに基づいた株価の将来予測などで活用されています。

(2)機械学習のアルゴリズム:

学習には様々なアルゴリズムが存在し、その一つが「ニューラルネットワーク」というものです。いわば「人間の脳神経の仕組み」のような記憶データ間の結び付きなどを知識・経験に従って変化習得していくものです。脳の回路に似たユニットで構成されており、「入力層」、「中間層」、「出力層」の3層からなり、「中間層」を深くしたものがディープラーニング(深層学習)の仕組みなのです。

(3)ディープラーニング:

膨大な量のデータを学習し、共通点を自動で抽出していくことによって、状況に応じた柔軟な判断を下すことが可能になる「機械学習技術」の一つで、ニューラルネットワークを発展させ、より高精度な分析を行うためのものです。ディープラーニングの具体例としては、画像の自動認識・生成や、自動運転などの作業支援、創作物の作成があります。画像の認識は、文字や顔の特徴を認識する「パターン認識技術」を指し、ATMの顔認証機能やスマートフォンの指紋認証機能などへ活用されています。また、文字やデータを入力する事で画像を自動生成することも可能となり、ウエブサイトの制作やインテリアデザインなどの仕事にも用いられています。作業支援の例としては、一般車の自動運転やビジネス資料の作成でも使われています。この技術を用いて、小説や音楽、絵画などの創作物も作成できるようになったため、AI活用の可能性は大きくなっています。

(a)画像の自動認識と生成:

機械学習では量(ある特徴要素の度合い)の加増判別に加えて、色などのデータも判定されますが、ディープラーニングでは、色などの予め決められた要素だけで判定するのではなく、「どこを見るか」を自動で学習していくわけです。まさに、人間が画像を見て認識する場合と同様で、言葉では表現できない微妙な特徴の違いも表現できるのが、ディープラーニングの大きな効果です。需要予測、株価予測などに導入され始めています。

(b)自動運転などの作業支援:

自動車の自動運転も、ディープラーニングによって進化しています。自動運転は複雑な論理の集まりで、まだ、無人で任せられるほど一般的ではないですが、近い将来欠かせない技術です。また、診断医療でも、がんの転移や血管の疾患の検知など、人による診断では誤る可能性が高い作業に、ミスの少ない機械診断を取り入れる可能性があります。

(c)創作物の作成:

小説や音楽など、個人の創造力が求められる分野でも、ディープラーニングによって、人間らしい抽象的な結果を創出できる可能性があります。最近のハリウッドでの「AIに仕事を奪われるかもしれないことへの」デモは注目を浴びました。

以上、極めて重要な技術としての人工知能(AI)というものの基礎を眺めてきました。次は、今、最も話題になっている「生成型AI」について解説しましょう。

3. 生成型AIとその代表的なサービス:

ここ最近になり、生成型のAIを活用したサービスが急速に増えてきました。生成型AIとは、データのパターンや関係を学習し、新しいコンテンツを作り出すことができるAIです。代表的な生成型のAIとして、ChatGPT Gamma AIを紹介します。

画像:Shutterstock.com

3.1 ChatGPTとは

これは、高度なAI技術によって、人間のように自然な会話ができるチャットサービスです。2022年末に公開され、無料で利用できる点でも注目を集めました。生成した文章の出来具合や人間味のある回答が、大きな話題になりました。

ChatGPTで出来ることは次の10点です。

  • 日常会話
  • テキストの翻訳
  • 文章の要約
  • テキストやコードの添削
  • メール文の作成
  • 企画書作成
  • プレゼン資料のひながたの作成
  • プログラミング(マクロ、Pythonなどのコード作成)
  • 表作成(関数作成)
  • 炎上リスクの判断

などです。現在は、ユーザー数も億人レベルを突破し、拡張版GPT-4. ChatGPT Plus (有料)などに改変されています。従来型に比べて、出力精度が向上しており、さまざまな企業・個人がChatGPT APIを活用して色々なサービスの開発を行ったり、コミュニティで活発な議論を行ったりするのに利用しています。さらに、昨年、音声や画像の認識機能が追加され、本格的マルチモーダルな生成型AIとなったのです。画像についてのレビューやDALL-E3を使った画像生成だけでなく、会話も楽しめるようになっています。もちろん、日本語版のアプリや音声入力も出来るようになり、2023年末には、GPT-4 Turboが発表されました。研究機関Open AIによって、言語モデルをベースに、与えられたテキストの指示に対して自然言語(例えば英語)を生成するもので、インターネット上にある膨大な情報を学習し、複雑な語彙や表現も理解できるのが特徴となっています。また、過去の会話内容に誤りがあった場合には、ユーザが訂正できるなど、より自然な会話に近づくための機能も搭載されています。現在もどんどんと改良がされており、進化をつづけています。

このChatGPTは、メールアドレスを登録すれば無料版が使えます。PCやスマートフォンでも利用できるので、ユーザ数が桁違いなのです。もちろん、有料プランもあります。

最新版では、「抽象」をより理解できるようになり、高度な推論や複雑な指示の処理能力が強化されて、より強力な想像力を持つようになっています。「画像の内容の説明」、「グラフの分析」、「画像内の問題に答える」、「画像内の異常な部分を検出する」といったことが出来ると言われています。ChatGPTでは、人間が描く文章と遜色のないレベルで文章を生成することが可能ですが、元となる情報は「過去にインターネット上に存在した情報であること」、さらに、「事実かどうかよりも単語の出現頻度や相互関係を考慮して文章を作成すること」などから、正確ではない回答を返す可能性があります。また、学習するデータには最新の情報が含まれないため、直近の出来事に関する質問に回答することも苦手です。また、そもそもの質問文の意図を完璧に理解できず、期待した回答とは異なる答えを出すこともあります。従って、生成された文章を鵜呑みにせず、自身で内容の真偽を確認することが重要です。

試しに使うための「登録や質問の入力などの手引き」が多くありますので、必要に応じて参照してください。

3.2 Gamma AIとは

Gamma AIとは、AIを活用したプレゼンテーション作成ツールです。ユーザが入力したテキストを元に、自動でスライドを生成します。また、ユーザ自身でスライドを生成することも、文書ファイルを読み込ませて自動で生成することも出来るのが特徴です。主に、

ー AIを用いて自動でスライドのデザインを生成する。

ー スライドのテキストをAIで生成する。

「ビッグバン」についての説明プレゼンテーション資料(数十ページ)をつくった例題が公開されています。生成されたスライド情報の内容を確認し、必要に応じて修正することはユーザの責任です。

3.3 画像生成AIサービス:

2022年ごろになって、日本にも画像生成AIがやってきました。Stable DiffusionやMidjourneyなどがあり、デザイン業界に大きな変化をもたらそうとしています。これまで自分では画像を作れなかったユーザや、有料で既存画像をダウンロードしていた人たちにとって便利なものですが、一方、画像や絵を作る芸術家や風景や人物を撮影してきたカメラマンにとっては脅威となっているのです。勿論、コピーライトや知的所有権の問題も出てきています。AIイラスト作成会社mimicは、既存の画像を元に新たな画像を生成するので「そっくり画像」になり大きな批判を受けてサービス停止に追い込まれました。Stable Diffusion や Midjourneyはオープンソースで公開し普及しています。両者の差は「搭載された訓練AIモデルの違い」や「画像生成AIに読み込ませるデータの違い」にあります。テキスト入力から画像を生成するので、既存の画像の真似ではないのです。従って、著作権の問題は概ね回避できるのです。(同じ版のシステムに全く同じテキストを入力した場合は「そっくり」になることが考えられますが!?)また、イメージを入力した場合はコピーライト問題で商用利用が禁止される場合も依然としてあります。

画像生成AIとは、ユーザが入力したテキストを頼りに、オリジナルの画像を数秒ないし数十秒で自動生成するシステムを指します。画像生成AIでは、入力する文字列や単語の数が多ければ多いほど(説明文章が詳細であればあるほど)、ユーザのイメージに近い画像を生成します。これから「画像生成AIで高品質な画像を作るには入力文(プロンプト)を専門に作成研究するプロンプトエンジニアリングと呼ばれる新しい仕事も登場しています。

画像の作成には、「アマゾンのジャングル」、「高層ビルが立ち並ぶ都会」など英単語を区切って入力することで、様々な画像を作ります。画像生成システムのインターフェース毎にテキスト入力を行うことと、その都度のカスタムオプションを指定することで出来るのです。従って、英文表現が得意なユーザは、より正確で高品質な画像を生み出すことが可能となります。Stable Diffusionでは、システムに搭載されている「潜在拡散モデル」というアルゴリズムに従ってユーザに入力を促してきます。ユーザはこれらの詳細を知ることなく、テキスト入力だけで様々な画像を作ることが出来るのです。

試しに使って見たい人は、webアプリに公開されているHugging Face、 Dream Studio、  Mageなどにアクセスしてみてください。

4. 今後の方向

今後、これらの技術は、非常に高い知能を持ち、汎用性が高く、人間に近い思考回路や感情をもつAIを目指していくでしょう。この動きは汎用型人工知能(AGI=Artificial General Intelligence)と言われます。AGIは思考の結果、「楽しい」や「悲しい」と言う人間特有の感情を理解して、AIの次の行動が選択される。いわば、感情を持つロボットのイメージです。

一例として、将棋におけるAI活用の現状をみると、AIによって、パターンの分析が進んでおり、人間の差し手を分析して、次の最善手を導き出したり、現状の対局者同士の勝率を分析したりします。また、人間がAIと対局したり、ある対局の将棋譜を読み込ませて、詳細な分析をすることもできます。しかし、これらはあくまでも「数値的な分析」です。AIは「局面から無数のパターンを分析し、最善の一手を導き出すための思考」をしているだけであって、「対局者の感情を読み取り、最善の手を指している」わけではないのです。AGIでは、「対局者の感情を理解し、相手の感情を踏まえて上での最善の手を選択する」ことを目指すのです。

AGI利用では、「AGIが自ら判断して人間に近い行動をとる」ので、仕事をしている人間の顔色や表情から疲労度を読み取って、疲れていると判断したら、休憩などの行動を選択することができます。また、医療現場で患者の顔色や表情からその日の体調を読み取り、患者一人ひとりに合わせた最適な処置を施すことも可能になります。

一つの分野だけで高度な知能を獲得して動く特化型とは異なり、AGIは多種多様な知識を利用して、さらにそれらを自ら進化させて応用できる可能性を秘めています。今後の社会構造の急激な複雑化や多様性の変化に対応して、色々な社会プロセスも進化しなければなりませんが、従来型の「特化型AI」では、環境の変化のたびにプログラムや仕組みを変更しなければならない。システムの再構築は膨大な手間とコストがかかるし、タイミングを逸します。このような背景ではAGIの活躍が期待されるのです。日本においては「2025年の崖」、少子高齢化などでの労働人口減少による「2040年問題」への対応のため、AGIへの期待が高まっているのです。

No.359

となりのおじさん

在米35年。生活に密着した科学技術の最新応用に興味を持つ。コラムへのコメントは、 [email protected]まで

シェアする

返信する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Social media & sharing icons powered by UltimatelySocial
Twitter
Visit Us
Instagram