
#SUNO #スノー #音楽生成AI #ChatGPT #Perplexity #Gemini
- 音楽生成AI(Suno・スノー)
- Sunoとは?
- 主な特徴
- 利用方法
- 用途・活用例
- Suno スノー の注意点
- 【1. 会話型AI(ChatGPT・Claude・Geminiなど)】
- 【2. 音楽生成AI(Suno・Udioなど)】
- 【3. 画像生成AI(Midjourney・DALL·E・Stable Diffusionなど)】
- 【4. 動画生成AI(Runway・Pika・Soraなど)】
- 【4. 動画生成AI(Runway・Pika・Soraなど)】
- 【5. 画像補正・変換AI(Remove.bg・GFPGAN・AI着せ替えなど)】
- 【6. 自動運転・ロボティクス系AI】
- 【7. 音声・読み上げAI(音声合成・音声認識)】
- 「Gemini」と「Perplexity」について
- 1. Gemini(旧Bard)– Google製の生成AI
- 2. Perplexity AI – AI搭載の次世代検索エンジン
- 【Gemini vs Perplexity 比較表】
- Gemini vs Perplexity まとめ
- 最近(2023年)話題のチャットGPT使ってますか? 先行AIの流れ
- ざっくりの理解はアップルのSiriやアマゾンのアレクサをすごーく進化させたAIかな。
- どうやって使うのかな⁈
- 実際にトライしてみょう。まずは下記のアドレスから登録する。
- チャットGPTを上手く使うにはいかに上手く条件を指示するかがポイントになります。
- 下記がチャットGPT(Open AI)にChatGPTについて説明してもらった結果です。
- 今一度、チャットGPT開発者について、チャットGPTに聞いてみました。
- グーグル(Google)も負けてられないので、『バード』を発表❗️
- GoogleのAI「Bard(バード)」は、2024年2月に「Gemini(ジェミニ)」に名称変更されました。
- 主なAIチャットボットであるChatGPT、Perplexity、Geminiについて
- まとめ
- ChatGPTとは何⁈ チャットGPT初トライ(2023.2)
- Apple Intelligence(AI)
- おすすめ本
- 北の大地十勝(北海道)に移住
音楽生成AI(Suno・スノー)

Second Life (第二の人生)キャンピングカー旅


Sunoとは?
音楽生成AIの中でも特に注目を集めているツールの一つです
**Suno(スノー)**は、テキストから高品質な音楽を自動生成できるAIプラットフォームです。ユーザーが歌詞やジャンル、雰囲気などをテキストで入力することで、AIが自動的にボーカル入りの楽曲を作曲・編曲・歌唱まで行ってくれます。
開発元はアメリカのスタートアップ企業「Suno AI」で、元はOpenAIに在籍していた技術者たちが中心となって設立されました。
主な特徴
1. 歌詞から自動で歌付きの曲を生成
- ユーザーが入力した歌詞に基づき、メロディ・伴奏・歌声がすべて生成されます。
- 歌声は合成音声(ボーカロイドのような)ですが、自然で表現力豊かです。
2. ジャンル・スタイルの指定が可能
- ロック、ポップ、EDM、ヒップホップ、ジャズ、クラシックなど、幅広いジャンルに対応。
- 「80年代風」「アニメソング風」「ビートルズ風」など、スタイルの細かい指示も通用します。
3. マルチリンガル対応
- 英語はもちろん、日本語にも対応しています。
- 日本語の歌詞を入力すれば、日本語で歌ってくれます(発音の精度もかなり高いです)。
4. プロンプト入力型UI
- ChatGPTのような感覚で、文章ベースで指示できます。
- 例:「切ない別れをテーマにした日本語バラードを作ってください」
利用方法
現在は「Suno v3」が公開中(2024年以降)
- Webベースのプラットフォームで提供。
- ユーザー登録すれば、無料枠でも一定数の楽曲生成が可能。
- プレミアムプランに加入すると、より多くの曲を作成・ダウンロードできます。
公式サイト: https://suno.ai

用途・活用例
- シンガーソングライターの作曲補助
- ゲームや映像作品のBGM・挿入歌制作
- 音楽の学習・分析用素材
- SNSやYouTubeの投稿用音楽
- アイデア出しやデモ制作の代替手段 など
Suno スノー の注意点
- 現時点では商用利用は制限されている部分があります(契約内容や利用規約を確認する必要あり)。
- 著作権や生成物の権利については、今後のポリシー変更に注意。
【1. 会話型AI(ChatGPT・Claude・Geminiなど)】
■ 特徴
- テキストベースで質問に答えたり、文章を生成したりできる。
- 多言語対応・論理的な対話・創造的なアイデア出しに強い。
- プログラミング、翻訳、要約、ライティングなどの用途に活用されている。
名称 | 特徴 |
---|---|
ChatGPT(OpenAI) | GPT-4搭載。知識の幅広さと自然な会話が強み。プラグインや画像生成なども可能。 |
Claude(Anthropic) | 倫理性重視。長文処理が得意で、扱いやすい。 |
Gemini(旧Bard, Google) | Googleとの連携が強く、検索結果に強い。 |
コパイロット(Copilot) | Microsoft製。OfficeやEdgeなどと統合。 |
【2. 音楽生成AI(Suno・Udioなど)】
■ 特徴
- 歌詞を入力するだけで、歌入りの音楽を自動生成。
- 作詞・作曲・ボーカルまで一括で可能。
■ 主なサービス
名称 | 特徴 |
---|---|
Suno | 日本語にも対応。高品質な歌入りの曲が作れる。 |
Udio | 英語曲に強み。音楽スタイルの多様性が魅力。 |
Soundraw | BGMやループ音楽向け。商用利用しやすい(日本企業発)。 |
【3. 画像生成AI(Midjourney・DALL·E・Stable Diffusionなど)】
■ 特徴
- テキストからイラスト・写真・アートを生成できる。
- 広告・ゲーム・アニメ・デザイン業界で活用されている。
■ 主なサービス
名称 | 特徴 |
---|---|
Midjourney | 芸術性が高く、アート寄りの画像が得意。 |
DALL·E(OpenAI) | 写実的で多用途。ChatGPTと連携可能。 |
Stable Diffusion | オープンソース。カスタマイズ性が高い。 |
【4. 動画生成AI(Runway・Pika・Soraなど)】
■ 特徴
- テキストや静止画から動画を生成。
- 短編動画や映像演出、CM、モック映像作りに使われ始めている。
■ 主なサービス
名称 | 特徴 |
---|---|
Runway | 画像→動画変換やAI編集に対応。YouTuberなどが活用中。 |
Pika | スタイルの選択肢が多く、リアルタイム生成も可能。 |
Sora(OpenAI) | まだ一部非公開だが、リアルな動画生成で話題。 |
【4. 動画生成AI(Runway・Pika・Soraなど)】
■ 特徴
- テキストや静止画から動画を生成。
- 短編動画や映像演出、CM、モック映像作りに使われ始めている。
■ 主なサービス
名称 | 特徴 |
---|---|
Runway | 画像→動画変換やAI編集に対応。YouTuberなどが活用中。 |
Pika | スタイルの選択肢が多く、リアルタイム生成も可能。 |
Sora(OpenAI) | まだ一部非公開だが、リアルな動画生成で話題。 |
【5. 画像補正・変換AI(Remove.bg・GFPGAN・AI着せ替えなど)】
■ 特徴
- 画像の背景除去、顔の修復、スタイル変換、着せ替えなどができる。
- 写真加工やSNS投稿、ビジネス資料にも利用可能。
【6. 自動運転・ロボティクス系AI】
■ 特徴
- カメラ・センサーからの情報を解析して、動作や経路判断を行うAI。
- 自動運転車、ドローン、ロボット掃除機などに組み込まれている。
【7. 音声・読み上げAI(音声合成・音声認識)】
■ 特徴
- 人間のように自然に話す音声を生成したり、逆に音声をテキストに変換。
- ナレーション・自動受付・音声アシスタント・字幕生成などに活用。
■ 主な技術
技術 | 内容 |
---|---|
音声合成(TTS) | テキストを自然な声で読み上げる。 |
音声認識(STT) | 音声をテキストに変換する。 |
「Gemini」と「Perplexity」について
「Gemini」と「Perplexity」は、どちらも近年注目を集めているAIサービスですが、目的や特徴が少し異なります。以下にそれぞれ詳しく解説します。
1. Gemini(旧Bard)– Google製の生成AI
● 概要
- Google DeepMindが開発した大規模言語モデル(LLM)。
- 旧名称は「Bard(バード)」で、2024年に「Gemini」に刷新されました。
- ChatGPTの競合にあたる対話型AI。
● 特徴
- Google検索との統合により、最新の情報をリアルタイムで取得・反映できる。
- YouTube、Gmail、Google Docs、Driveなどと連携可能(Gemini Advanced)。
- コード生成・解説、翻訳、要約、企画のブレストなども得意。
- Gemini 1.5では「100万トークン」超の長文コンテキスト対応が可能(Claude 3と同等クラス)。
● 活用シーン
- 資料作成、調べもの、メール返信の下書き、アイデア出し、学習補助など。
2. Perplexity AI – AI搭載の次世代検索エンジン
● 概要
- 検索エンジン×生成AIを融合させたツール。
- ChatGPTのように質問を入力すると、ネットの最新情報に基づいて回答してくれる。
- 回答には**出典(引用リンク)**もついてくるため、情報の信頼性が高い。
● 特徴
- インターネットの最新情報に強い(常時Web検索)。
- 回答に根拠となるWebページのリンクを明記してくれる。
- モデルにGPT-4やClaudeを使っている(Proプランでは選択可)。
- 無料でもかなり高機能。
● 活用シーン
- リサーチ、論文・記事の下調べ、比較検討、事実確認。
- 「ChatGPT+Google検索」のような感覚で使える。
【Gemini vs Perplexity 比較表】
項目 | Gemini(Google) | Perplexity |
---|---|---|
開発元 | Google DeepMind | Perplexity AI(米スタートアップ) |
主な用途 | 会話・創作・学習・Google連携 | 調べもの・事実確認・リサーチ |
強み | Google製サービスとの連携、長文処理 | 最新情報に強い、出典付き回答 |
検索機能 | 検索可(Googleベース) | 常時Web検索ベース |
無料使用 | 可能(Gemini Basic) | 可能(Proは有料) |
日本語対応 | 対応 | 対応(精度も高い) |
Gemini vs Perplexity まとめ
- Gemini:ChatGPTのような対話・創作・日常サポートに強い。Googleと連携できるのが魅力。
- Perplexity:調査・検索・事実確認など「調べもの」に特化したAI。出典が明示されて安心。
どちらも無料で試せるので、「日常的な会話や発想の補助」ならGemini(ジェミニ)、「調べ物や情報の裏取り」ならPerplexity(パプちゃん)がおすすめです。
最近(2023年)話題のチャットGPT使ってますか? 先行AIの流れ
Chat GPT(Generative Pre-trained Transformer)とはサンフランシスコのOpenAI社が生み出した最新のAIチャットボットです。私が初めてトライした時はまだあまり使ったかたがいませんでしたので、情報不足で模索しながらアカウントを作成した覚えがあります。最近やたらとテレビやネットで騒いでいますが、皆さんと一緒に今一度現時点での情報をお伝えします。
ざっくりの理解はアップルのSiriやアマゾンのアレクサをすごーく進化させたAIかな。
そもそも.アップルのSiriやアマゾンのアレクサを使った事がない方は、なんだとなりますよね。AIとは(人工知能ツール)で、対話しながら人工知能で応答してアンサーを出してくれるものです。我が家も照明やテレビをつけてもらったりして便利に使えてます。
チャットGPTはさらに進化しているらしく期待しています。
ただし、まだ音声入力には対応してない様で、テキスト入力になるようです。
(デモ)新Bing検索エンジンに搭載予定
どうやって使うのかな⁈
誰でも使用可能です。
最初にアカウントを作成する必要
- 基本的に無料のようですが、(GPT4)月額料金のプラスプラン(20ドル)もある様です。
実際にトライしてみょう。まずは下記のアドレスから登録する。
メールアドレスとパスワード登録したら、確認のメールが届き、次は携帯電話番号を入力するとSNS認証の番号が届き、番号を入力すると登録完了。
その後は、上記のアドレスから登録したメールと決めたパスワードを入力したらログインができる。
それでは早速トライ。
チャットGPTを上手く使うにはいかに上手く条件を指示するかがポイントになります。
#命令文:
あなたは「 プロの編集者 」です。
以下の制約条件と入力文をもとに「 最高の要約 」を出力してください。
#制約条件:
●文字数は400文字程度
●小学校でもわかるように
●重要なキーワードは取りこぼさない
●文章を簡素に
#入力文:
<入力例:北海道十勝帯広名物 豚丼の魅力を紹介>
#出力文:
下記がチャットGPT(Open AI)にChatGPTについて説明してもらった結果です。
チャットGPTは、OpenAIが開発した大規模な自然言語処理モデルの一種です。GPTは、Generative Pre-trained Transformerの略称で、自然言語処理のタスクを実行するために訓練されたニューラルネットワークモデルです。
チャットGPTは、会話をシミュレートするために訓練されたGPTの変種で、人工知能によるチャットボットの開発に利用されます。ユーザーとのインタラクションを通じて、質問に回答したり、会話を続けたり、推論を行ったりすることができます。
チャットGPT(Generative Pre-trained Transformer)は、自然言語処理におけるAI技術の一つで、コンピュータが人間のように自然に文章を生成することができるようになったものです。これにより、ユーザーとのチャットにおいて、自然で流暢な返答を提供することが可能になります。また、GPTは学習により、ユーザーとの会話から得られる情報を蓄積し、より精度の高い返答を生成することができます。
と言う具合です。(凄ーい!驚きです)
これからもっと進化すると、消滅または縮小する職種もでてきそうです。
条件を付け加えて「小学校にもわかるように」お願いすると下記の内容になります。

今一度、チャットGPT開発者について、チャットGPTに聞いてみました。
チャットGPTは、OpenAIによって開発された自然言語処理のモデルの一つです。OpenAIは、人工知能の研究や開発を行う非営利団体で、Elon Musk氏やSam Altman氏をはじめとする著名な投資家や科学者たちによって設立されました。OpenAIの目的は、人工知能の進歩を通じて、人類の福祉を促進することです。
チャットGPTの開発には、GPT-3と呼ばれる大規模なトレーニングデータを用いた自己教師あり学習アルゴリズムが使用されました。GPT-3は、OpenAIが開発した最新の自然言語処理モデルであり、13億個のパラメータを持ち、広範な自然言語理解タスクにおいて非常に高い性能を発揮します。チャットGPTは、GPT-3をベースにして、より対話的な応答を生成できるように改良されたものです。
チャットGPTの開発には、OpenAIの研究者たちが関わっています。具体的には、Alec Radford氏、Jeff Wu氏、Rewon Child氏、David Luan氏、Dario Amodei氏、Ilya Sutskever氏、Girish Sastry氏、John Schulman氏、Sam McCandlish氏、Christopher Berner氏、Jared Kaplan氏、Tom Henighan氏、Sebastian Borgeaud氏、及びNick Ryder氏が開発に貢献しています。
グーグル(Google)も負けてられないので、『バード』を発表❗️
Googleのバードを発表❗️
高精度な会話型AI「ChatGPT」に対抗すべく、グーグルが「Bard」を発表した。これから数週間のうちに利用可能になる見通しで、APIによって開発者が独自のアプリケーションを構築できるようになる点が特徴となる。
GoogleのAI「Bard(バード)」は、2024年2月に「Gemini(ジェミニ)」に名称変更されました。
GoogleのAI「Bard(バード)」は、2024年2月に「Gemini(ジェミニ)」に名称変更されました。
主な変更点は以下の通りです。
- 名称変更:
- 「Bard」から「Gemini」へ変更されました。
- これは、Googleの最新かつ最も高性能なAIモデル「Gemini」をより前面に押し出すためです。
- 機能の強化:
- 「Gemini」は、テキストだけでなく、画像、音声、動画など、さまざまな種類の情報を理解し、生成できる「マルチモーダル」機能を強化しています。
- より複雑な質問やタスクに対応できるよう、性能が向上しています。
- 提供形態の拡充:
- 無料版に加えて、より高度な機能を利用できる有料版「Gemini Advanced」が提供されています。
- スマートフォン向けのアプリ版もリリースされました。
- Googleサービスとの連携強化:
- Googleの各種サービス(Google検索、YouTubeなど)との連携が強化され、より包括的な情報提供が可能になりました。
つまり、「Bard」は「Gemini」として進化し、より高性能で多機能なAIチャットボットになったと言えます。
主なAIチャットボットであるChatGPT、Perplexity、Geminiについて
主なAIチャットボットであるChatGPT、Perplexity、Geminiについて、それぞれの特徴を比較し説明します。
1. ChatGPT
* 開発元: OpenAI
* 特徴:
* 非常に広範な知識を持ち、多様なタスクに対応できる汎用性の高さが特徴です。
* 自然で人間らしい会話能力に優れており、文章生成、翻訳、要約、質疑応答など、幅広い用途に利用できます。
* プラグインやGPTs(カスタムChatGPT)などの拡張機能が豊富で、様々なニーズに対応できます。
* 有料版のChatGPT Plusでは最新のGPT-4モデルを利用でき、より高度な処理が可能です。
* 得意分野:
* 文章作成(小説、脚本、記事など)
* プログラミング
* 翻訳
* アイデア出し
* 注意点:
* 情報が古い場合がある。
* 事実に基づかない情報を生成する可能性がある。
2. Perplexity
* 開発元: Perplexity AI
* 特徴:
* 検索エンジンと連携しており、最新の情報に基づいた回答を提供することに特化しています。
* 回答の根拠となる情報源を引用してくれるため、情報の信頼性を確認しやすいです。
* 学術研究や情報収集など、調査・研究分野での利用に適しています。
* 得意分野:
* 情報収集
* 調査・研究
* 最新情報の把握
* 注意点:
* 情報源の正確性を自身で確認する必要がある。
3. Gemini
* 開発元: Google
* 特徴:
* Googleが開発した最新のAIモデルであり、テキスト、コード、画像、音声など、様々な種類の情報を理解し、生成することができます。
* Googleの各種サービス(Google検索、YouTubeなど)との連携が強化されており、より包括的な情報提供が可能です。
* 特にGoogleのサービスとの連携に強みを発揮します。
* 得意分野:
* Googleサービスとの連携
* マルチモーダルな情報処理
* 高度な質問応答
* 注意点:
* まだ開発中の部分があり、今後の進化に期待されます。
それぞれのAIの最適な使い方
* ChatGPT: 幅広いタスクに対応できるため、日常的な質問や文章作成、アイデア出しなど、様々な場面で活用できます。
* Perplexity: 最新の情報に基づいた回答が必要な場合や、情報の信頼性を確認したい場合に適しています。
* Gemini: Googleの各種サービスと連携した情報が必要な場合や、マルチモーダルな情報処理が必要な場合に強みを発揮します。
これらの情報を参考に、ご自身のニーズに合ったAIチャットボットを選んでみてください。
まとめ
まだ、指示画面は英語ですが、日本語にも対応していますので、ぜひ挑戦(トライ)してみてください。使って慣れてくれば、良い相棒になると思います。
オープンAIの開発者も来日して、日本への関心も強まっているので近いうちに日本語バージョンができて、より使いやすくなる事を期待しています。
まだまだ、使いきれていませんが、チャットGPT4(有料版)が有効に使えるようにしていきたいですね。
ChatGPTとは何⁈ チャットGPT初トライ(2023.2)
Apple Intelligence(AI)
Apple Intelligence(AI)
アップル社のAIです。Siriが進化!ChatGTPとImage Playgroundも注目です。
おすすめ本
本当の自由を手に入れる お金の大学 (改訂版) 両@リベ大学長

北の大地十勝(北海道)に移住
tokachi_sky (とかちスカイ)北の大地十勝 Kita-no-Daichi Tokachi


コメント