技術研究

Google Cloud のSpeech-to-Textを動かしてみる

皆さんこんにちは、マツムラです。六月に入り今年も約半分が過ぎようとしています。梅雨の湿気や低気圧に負けないように頑張っていきたいと思います。 本記事ではGoogle Cloud のSpeech-to-Textを、Goog […]

Docker と WSL と VPN と格闘してみた!!!

皆さんお久しぶりです。最近も生成AIの大流行が続いていて、OpenAIやMicrosoft、Googleなど、多くの企業が様々なサービスを提供しています。私はその進展に追いつくのがやっと(おそらく追いつけていない)で、A […]

manim×Claude3で動画素材を大量制作する

 大規模言語モデルである「Claude3」のリリース日(2024年3月4日)から、はや1ヶ月以上が経ちました。GPT-5も2024夏くらいにリリースとのことで、生成AIの流行の波はまだまだこれから加速していきそうです!G […]

AWSのAmazon Transcribeを動かしてみる

皆さんこんにちは、マツムラです。年度が変わり、新入社員も増え、明るい季節となりました。心機一転、今年は挑戦の年にしていきたいと思います。 本記事ではAmazon Transcribeを、GoogleColaborator […]

音声認識AIモデル”Whisper”を動かしてみる

皆さんこんにちは、マツムラです。一気に冷え込み、PC排熱で暖を取り始める季節になりました。 本記事ではOpenAIより提供されている音声認識AIモデル”Whisper”を、GoogleColaboratoryで動かしてみ […]

今から始めるYOLOX

皆さんこんにちは、マツムラです。猛暑日が続き、PC排熱で部屋がより暑くなる季節になりました。 本記事ではGoogle ColabratoryでYOLOXを動かした後、一部改変を行い出力結果の表示を変更してみます。 これか […]

命令文を改善してChatGPTとBingAIにブログを書かせよう

おはようございます。我々のチームはクスノキさんが一昨年から入社、今年3月にはヒラタニ本部長が退職され、激動の数か月を過ごしている……わけでもなく、ワイワイと日々楽しく過ごさせていただいています。 本記事では、ChatGP […]

【2022年AIモデル紹介】外観検査AIモデル PatchCore の紹介

こんにちは、クスノキ(クッスン)です。本記事が初投稿になります!今後、様々な記事を紹介できればと思っていますので、よろしくお願いします! 本記事では、外観検査AIモデル PatchCore を紹介します。最初に、Patc […]