ループバックとはヘッドホンやスピーカー用などにオーディオ出力した信号をマイク入力に変えること。
ニーズありそうなのにコレが売られているの初めて見た。ニーズが増えれば普通にダイソーで売られそうなもんなのに。
こちらに自作方法が
この抵抗とコンデンサの入れ方で20dB減衰するってところが理解出来ないな。
Windowsだと仮想オーディオドライバーってのがあるんだけど
スマホでオーディオのループバック(出力した音を入力に入れる)にはこれを使うしかないか?これがあれば録音した音や動画をPixelのレコーダーの文字起こしにつっこんだり出来る。
Category:未分類
Follow @fetuin
■ ■ ■ コメント ■ ■ ■
いいっすね!=96
001 [07/07 20:47]j@BM:録音した音の文字起こしなら、openaiのwhisperってモデル使ったけど結構普通に文字起こしできました。日本語も中国語も同等レベルくらいで出来た。文字起こしそのままだと微妙に変な文字とか入るから、chatgptにぶち込むとキレイキレイしてくれます。まぁそこまで含めたAPI使ったとこまでchatgptにPython書いてもらえばいいだけと思いますが。whisperで検索してサンプルコードか、gpt様に書いてもらえばびっくりするぐらいにすぐ出来ます ↑(26)
002 [07/09 12:52]ふぇちゅいん(主宰) TW★97:秘密の会議をクラウドの文字起こしサービスにかけるのは少し気が引けるんだよね。今更だけど。 ↑(32)
003 [07/09 22:48]j@BM:whisperもモデルダウンロードしてローカル実行出来ますのでお試しあれ〜って、どちらもopenaiとかGoogle様のものなので、完全に秘匿守られてるかを気にするのは…… ↑(18)
本カテゴリーで直近コメントが書かれた記事
→カテゴリー:未分類(記事数:1003)
本カテゴリーの最近の記事(コメント数)




