2025年技術ブログ集

faster-whisperの調査

音声認識モデル(faster-whisper)の調査1.faster-whisperとは日経ソフトウェア2025年11月号(P36-P48)で、OpenAIが開発したオープンソースの音声認識モデル「Whisper」を高速化した派生モデルが「...
2025年技術ブログ集

VLMによる伝票処理アプリ

VLMによる伝票処理アプリ1.スキャンPDF画像のOCR課題ローカル生成AIでVLM(Visual Language Model)が画像分類などで有効なことを報告しました。今回は一般的な事務作業での活用検討の報告です。以前、コードレスのAI...
2025年技術ブログ集

機械学習(回帰)+LLMアプリ

その1 構造データに対してのLLMの限界 ローカルでもLLMやVLMの性能が上がってきています。Copilotによるとcsv解析に適したLLMとして、「Mixtrail:8x7b」と「DeepSeekV2」があるようです。Mixtrail8...
2025年技術ブログ集

簡便な画像生成アプリ

その1 CPUで動く画像生成アプリの開発(txt2img) Stable-diffusionは画像生成AIとして有名です。GUIとしてはAutomatic1111やComfyUIなどがあります。Automatic1111はtxt2imgの他...
2025年技術ブログ集

チャットボットのカスタマイズ

その1 生成AIアプリの開発(チャットボット) 以前、Llama3.2などの軽量モデルとRAGデータを使って獣医先生と会話する専用チャットボットアプリを作りました。以下に示します。生成AIプリ① | TWINKLE TEC日経ソフトウェア2...
2025年技術ブログ集

生成AIプリ①

その1 生成AIアプリの開発(チャットボット) これまでは、OpenwebUIやAutomatic1111などのUIツールを使って生成AIの勉強をしてきましたが、そろそろpythonでアプリを作りたいと思い始めています。色々と書籍を買って読...
2025年技術ブログ集

ローカル生成AI環境整備状況

その1 パソコンいじりの復活 マイローカル生成AIブームが始まって半年たちました。私のローカル生成AIの環境も省スペース化をはかっています。まず前半はタワーケースからオープンフレームにしたことで40%の省スペース化が出来ることが判り、邪魔に...
2025年技術ブログ集

従来Aiと生成AIの比較

その1 生成AIにる3D合成の調査従来AIと生成AIの比較及び事務業務以外への生成AIの応用について検討しようと思いました。昭和の技術者としては、生成AIを技術分野で活用できないかと考え、まず試してみようと思いました。以下の3つの分野で従来...
2025年技術ブログ集

生成AIインストーラ pinokio

その1 生成AIアプリのインストーラ pinokio 生成AIは、個人的には文書生成やコード開発、会社では事務処理の自動化等で定着し始めていますが、ほかの分野でも多くのアプリが作られているようです。動画生成や音楽生成等で俳優や作曲家の将来は...
2025年技術ブログ集

ボーリングの科学その3

その1 投球時の手の動きを検出する BL01やBL02システムで投球時の骨格抽出と角度特徴値を抽出するところまでは既報です。今回は、カメラでは捕らえられない手の動きを測定し分析するシステムを作りました。教育用マイコンmicrobitを使用し...