**Vector Database(ベクトルDB)**とは、Embeddingを保存・検索するための専用データベースだよ。 前回の記事で、言葉を**数字(ベクトル)**に変換するEmbeddingを学んだよね。 でも、このベクトルをどこに保存する? どうやって「似たもの」を探す? 普通の ...
LLM の課題に対する包括的な洞察: コンテキスト認識や精度の問題など、LLM の制限を理解します。 RAG およびベクター データベースの紹介: これらの技術が従来の LLM の欠点にどのように対処するかを調査します。
三菱UFJフィナンシャル・グループ(以下MUFG)の戦略子会社であるJapan Digital Design(以下JDD)でMUFG AI Studio(以下M-AIS)に所属する浦田です。JDDに入社してから初めてのエントリになります。 はじめに 今回は、Databricks環境を使ってLLM(大規模言語モデル)を ...
多くのLLMで採用されている位置符号化※1であるRotary Position Embedding(RoPE) ※2がウェーブレット変換の一種であることを解明し、ウェーブレット変換※3が位置符号化に有効である可能性を示しました。 ウェーブレット変換を応用した独自の位置符号化を開発し ...
Googleの人工知能部門の責任者を務めるスゴ腕エンジニアのジェフ・ディーンがかつて作成した「すべてのエンジニアが知っておくべき数字」に習って、「大規模言語モデル(LLM)の開発者が知っておくべき数字」が元Googleのエンジニアだったワリード・カドス ...
異なるグループやクラスのユーザーが同じベクターデータベースを共有するマルチテナント環境では、あるグループのエンベッディングが別のグループの LLM からのクエリに応答して不注意に取得される可能性があり、機密性の高いビジネス情報が漏れる可能性があります。