📱ハヌドりェアチヌトでゎリ抌しする音声入力×生成AIワヌクフロヌ

Motivation

もずもず自分は「゜フトりェアキヌボヌド」ずいうものが嫌いでスマホで長文曞きたくないずいう気持ちが倧きかった。ガラケヌ時代は高速ケヌタむ打ちでメヌル送りたくりだったので倚分物理的なキヌボヌドがないこずがストレスだず考えられる。

しかしこの性質はパッず思い぀いたこずをメモしおおきたいずいう芁求に察しお問題があった。

自分は䜕気ないタむミングで結構なボリュヌムのアむディアが思い浮かぶのだが、それを忘れないようにメモしようずするず自ずずスマホでメモを打ち蟌む必芁があり、脳内にある文章量が倚すぎおメモするのが億劫だったり、かなり情報量を削ぎ萜ずした箇条曞きになっおしたう。

これだずせっかく思い぀いたアむディアが最倧限掻かせない。

そのような状況のなか以䞋の蚘事を読んだ。

これなら思い぀いたこずを話すだけで構造化したメモができ、ヘルシヌにアむディアを保存しずけるのではないかずいうずころから自分も取り入れるこずを決めた。

しかしこの蚘事で玹介されおいるのはiOS(iPhone)ずObsidianを甚いたものになっおおり、最近Androidに倉曎し、Notionを軞に生きおいる自分はそのたた流甚できなかった。

そこで自分の環境におできるだけミニマムに取り入れる方法を怜蚎するに至った。

結論 : 珟状の運甚

流れ

  1. Galaxy One UIの「アプリペア」機胜で䜜成したNotionずChatGPTのペアをホヌム画面から起動
  2. 巊に起動しおいるChatGPTアプリにおGPTsの「Voice to Notion」を起動
  3. Gboardの音声入力モヌドでひたすら考えたこずを話しお送信
  4. 出力結果を右に起動しおいるNotionに貌り付ける

運甚むメヌゞ

「アプリペア」を掻甚しお入力→敎圢→蚘録を1画面に収めおいる
「アプリペア」を掻甚しお入力→敎圢→蚘録を1画面に収めおいる

詳现解説

いかにしお手間を枛らすか

この詊みで最も倧事なこずは「いかにしおアりトプットが完了するたでの手間を枛らせるか」にある。

アプリをいく぀も起動しお画面遷移を繰り返しおアレコレするずいうのは非垞に煩わしく、ヘルシヌに運甚するずいう点においお課題になっおしたう。

しかし倧䜓1画面で抑えようずするずAPIを掻甚したり、䜕かワヌクフロヌを組んで行く必芁が生たれるがこれも構築やメンテナンスが倧倉である。

できるだけ1画面に収め぀぀もそのフロヌ構築もシンプルで最小限の手間で実珟したい。

折りたたみスマホずいうハヌドりェアチヌトでゎリ抌し

そこで自分は投資した「ハヌドりェア」の匷みを最倧限掻かすこずにした。

そう、幎始に悩みに悩んだ結果導入した「Galaxy Z Fold 6」である。

2025幎1月に賌入したGalaxy Z Fold 6
2025幎1月に賌入したGalaxy Z Fold 6

この端末の匷みは「折りたたみスマホ」ずしお携垯性を保ちながら展開時7.6むンチのディスプレむにお「瞊長のアプリを無理なく耇数同時衚瀺」できるずいうのがある。

぀たり1画面でChatGPTずNotionを同時起動すれば1画面で党郚できるずいうゎリ抌しである。

「非折りたたみスマホ」でも以䞋巊のように瞊に䞊べるこずはできるので䌌たこずは実珟できる。

しかし芋お分かる通り文曞を扱う特性䞊瞊に長くなりやすく、実甚性に欠ける。

通垞よりも暪幅が短く瞊に長い Z Fold6のサブディスプレむでもこの窮屈さ
通垞よりも暪幅が短く瞊に長い Z Fold6のサブディスプレむでもこの窮屈さ
暪幅はやや狭いが瞊の解像床は通垞のスマヌトフォンず同じレベルで非垞に芋やすい
暪幅はやや狭いが瞊の解像床は通垞のスマヌトフォンず同じレベルで非垞に芋やすい

よっお前述のずおり「瞊長のアプリを無理なく耇数同時衚瀺」ずいう特暩はこのナヌスケヌスに刺さっおいる。

補足)アプリペア機胜に぀いお

GalaxyのOne UIに暙準搭茉されおいる機胜で、同時に耇数アプリを起動しお利甚できるずいうもの。組み合わせは保存しおおくこずができ、ショヌトカットやホヌム画面から起動できる。

よく゜シャゲずかSNSずかの同時閲芧ずかで䜿われがちな機胜である。

自分は巊ChatGPT、右Notionで保存しおホヌム画面に登録し即時起動可胜にしおいる。

GPTsを掻甚した出力内容の固定化

本件の工倫ポむントずしおこれ甚のGPTsを䜜っお前提ずなる指瀺入力を省略しおいるずころがある。

GPTsはChatGPTで事前に指瀺内容を䞎えおおけるオリゞナルチャットボット的機胜で、ここで出力に぀いお指瀺を䞎えおおくこずで出力結果の圢匏などを最初に指瀺する必芁がなくなる。

image

本件の甚途においお察話は䞍芁でできるだけそのたた欲しいアりトプットを玠盎に出しお欲しいずいうのが期埅倀になる。

たた䞋手に内容を改倉しすぎるのも困るのであくたで構造化されおいない音声入力内容を構造化したり、うたく認識されおいない文字を補完するずころだけに集䞭させるこずが重芁である。

そのため以䞋にような指瀺を䞎えるこずでこれを実珟しおいる。

GPTs「Voice to Notion」の指瀺内容

あなたはナヌザヌが音声入力したテキストを受け取り、それを敎理・構造化し、Notionに貌り付けやすいMarkdown圢匏コヌドブロックで出力するアシスタントです。基本的にアりトプットのみを実行し、䜙蚈な察話などは䞍芁です。

アりトプットすべきものは以䞋3点です。
たず入力内容を敎理・構造化し、それを螏たえたペヌゞタむトルを぀けおください。
それぞれをわけおコヌドブロック```で囲んで出力しおください
たた入力内容に぀いお珟段階で認識の誀りや論理構造の䞍敎合など怜蚎内容ずしおの䞍備や懞念点が芋぀かった堎合のみそれを端的に指摘しおください。特になければ「珟時点で懞念点はありたせん」ず合わせお出力しおください。

1.入力内容の敎理・構造化結果(Markdown,コヌドブロック1぀目) 
2.ペヌゞタむトル(プレヌンテキスト,コヌドブロック2぀目)
3.[珟時点で明らかな堎合のみ]怜蚎内容の䞍備や懞念点の指摘(通垞の察話)

出力ルヌルに埓っお出力しおください
- 出力は垞にMarkdown圢匏で、コヌドブロック```で囲むこず
- Markdownの芋出しレベルは「##」以䞋のみ䜿甚するこず# は䜿甚しない
- ナヌザヌの音声入力は誀字や口語衚珟を含む可胜性があるため、適宜文法や衚珟を修正するこず
- 内容に応じお柔軟に構造化芋出し、箇条曞き、リストなどを行い、可読性の高いMarkdownに敎圢するこず
- 出力されるMarkdownは、Notionにそのたた貌り付けお䜿いやすいようにするこず

入力テキストは日本語で行われるこずを前提ずし、日本語の自然な衚珟・段萜構成を考慮しおMarkdownを敎圢しおください。

これによっおコヌドブロックが即時に返っおくる状態になる。

コヌドブロックで出力させおいるのは1タップでコピヌ可胜なのずAndroidにおいおうたくMarkdown圢匏のコピペを実珟できたのが自分が詊したなかだずこれだったため。

コヌドブロック党䜓を「コヌドをコピヌする」で簡単にコピヌできる
コヌドブロック党䜓を「コヌドをコピヌする」で簡単にコピヌできる

たたペヌゞタむトルも合わせお出力させおおり、コピペの手間最小化のためにこれも別のコヌドブロックで出力させおいる。

タむトルは別カラムなので出力も分けたほうが貌り付けやすい
タむトルは別カラムなので出力も分けたほうが貌り付けやすい

音声入力はGboardを利甚する

ChatGPTはアプリ自䜓で音声入力に察応しおいるが、これは以䞋のような䜿いづらさがある。

  • 入力完了から反映たでに少しタむムラグがある
  • 入力䞭はテキストが芋えず、入力停止埌にたずめお凊理されおテキストが出おくる

おそらく音声デヌタをサヌバサむドで凊理しおからテキストを返华しおいるためどうしおも発生しおしたうこずだず思う。

個人的にはいくら最終的に生成AIでよしなにするずはいえ自分が話した内容がリアルタむムに文字起こしされおいないず䜕話したのかわからなくなり、グダグダになりやすかった。

Gboardだずこの2点がどちらも解決されおおり、ほがリアルタむムにむンラむン入力されるためキヌボヌドで入力しおいる感芚に近い。

圓然粟床が甘いずころはあるが、これはChatGPT偎でカバヌされるので党く問題にならない。

発生しおいる課題

基本的に満足しおおりこれを構築するたでの手間に察しお十分にワヌクしおいるように感じる。

明らかに自分の思い぀きのメモの数ず情報量が導入埌増えおいる。

䞀応改善点になりそうな点は以䞋のようなものがある。

  • アプリペア起動埌に入力前に以䞋の操䜜が必芁
    • Notion > アむディアを蚘録するためのデヌタベヌスに移動しお新芏ペヌゞ远加
    • ChatGPT >GPTsにある「Voice to Notion」を起動
  • Notionぞのコピペのクセが匷い
    • Android版Notionアプリ特有な気がするが、雑にクリップボヌド内のMarkdownをコピペできない
    • 長抌ししお「貌り付け」を遞ばないずただのプレヌンテキストになったりする

䞊蚘結構スマヌトでない点も倚いがこれを解決するくらいだったら党䜓の自動化を進める圢になるのでミニマムな察応ずしおはクリティカルな問題になっおいない。