@article{oai:edo.repo.nii.ac.jp:02000020, author = {西条, 昇 and 植田, 康孝 and 新井, 心 and 伊藤, 颯真 and 稲葉, 響}, journal = {江戸川大学紀要}, month = {Mar}, note = {P(論文), 大規模言語モデル(LLM)と共に進化が速い分野が「画像生成AI」である。「画像生成AI」とは,イメージの元になる画像や,「呪文(プロンプト)」と呼ばれる単語の組み合わせを入力することで,画像を自動生成する仕組みである。言葉と画像の組み合わせをひたすら学習させると,ユーザーが入力したキーワードに沿ったAI アイドルを出力できる。どのようなアイドルが出て来るのか生成されるまで分からないため,ワクワク感があり,指示通りに出て来た嬉しさもある。期待通りではなくても「こんなのが出て来た」という発見であったり,こうやって作ろうかな,と思えたりする。人間の想像を超えたものが出て来る面白さはAI ならではである。「Stable Diffusion」や「Midjouney」が生まれた2022 年7 月は,風景や建物は素晴らしいものがあったが,人物は「指の数が6 本(1)」「腕の曲がり方が変」というものが生成され,人の描写は苦手だった。しかし,2023 年4 月にリリースされたマイクロソフト「Bing Image Crator」ではかなり改善された。更に2023 年7 月には改良版として「Stable Diffusion1.0(SDXL)」がリリースされた。生成AI の実習で興味深かったのは,学生がAI アイドルの生成に積極的に取り組んでくれた点である。AI アイドルの出来栄えよりも生成AI の活用によっていかにして推しのアイドルを楽しく生むかという視点を目指した。学生が興味を持つ対象で圧倒的に熱量が高いのが「推し(2)」(応援する対象)であり,推しに類似した人物画像をクリエイトすることは非常に楽しかったようである。画像生成AI を用いた実習の優れた点は,AI に適切なプロンプト(指示文)を与えないと,自分がイメージする画像が得られないことを文章生成AI よりも確認し易いことである。やると分かるが,画像のイメージをテキストで伝えることは非常に難しい。特に人物を生成する際にはネガティブプロンプトも駆使しなければ,思うような画像は生成できない。頭ではイメージ出来ているのにプロンプトが思い付かない,思い付いたとしても上手く反映されないことを度々経験する。テクノロジーは知ることが目的ではない。「知ったことをどのように生かすのか」「テクノロジーによって自分の行動をいかに変えるのか」がポイントである。AI アイドルは,曲によって歌う人を変えられたり,ダンサーを変えられたりと可能性が無限大である。生成AI を正しく理解する方法としては,複数サービスを使い,どうすれば精度が上がるかを試すことである。どのような機能があるのか実習を繰り返しながら知ることが必要である。待っていればAI の性能が向上すると思われがちであるが,学生には別の問題がある。2022 年度のゼミや演習実習で学生に取り組んでもらった「Midojourney」は2023 年度では使用できなくなった。サービスが有料化されたからである。アドビ「Firefly」は著作権をクリアした画像に限定してデータセットに用いたため商用利用をし易くなったが,生成画像の質は低くなってしまった。生成AI の進化が激しいため,あっという間に陳腐化してしまう。色々試しながら瞬発的に動くしかない。}, pages = {153--177}, title = {AI で学生は創造的になれる(アイドル)}, volume = {34}, year = {2024}, yomi = {サイジョウ, ノボル and アライ, ココロ and イトウ, ソウマ and イナバ, ヒビキ} }