Banco de Dados Vetorial

Você já segurou
a solução nas mãos.

Memória persistente com crossover entre IAs — o que uma sabe, todas sabem. Busca semântica de 100% de recall em cubos isolados, para qualquer LLM (Claude, GPT, Gemini, local), com N cubos de crossover.

💡 O insight:Cada face do cubo é uma dimensão semântica (Tópico · Entidade · Tempo · Sentimento · Campo · Cultura).
Vetor Semântico Exato384 D
Latência por Cubo Isolado~28.7 ms
Recall Multi-Tenant100%
Custo de GPUZero GPU
CROSSOVER DE MEMÓRIA

A IA de casa lembra
o que a IA do trabalho aprendeu.

O que uma IA aprende, todas sabem. A memória não fica presa num modelo nem numa máquina — vive no seu cubo, e qualquer LLM que você conectar lê e escreve o mesmo contexto.

🏠Claude — em casa
🏢GPT — no trabalho
📱Gemini — no celular
🧊1 Cubo
memória compartilhada · persistente
A Projeção: seu dado no ponto exato

6 eixos.
384 dimensões exatas.

Você já segurou um cubo mágico nas mãos — agora veja a projeção dele. Cada texto vira um ponto em coordenadas exatas (0.9, 0.5, …) dentro do cubo de 384 dimensões. A informação mora na posição precisa, não no canto. Representação exata do significado, sem aproximação.

Resolver o cubo = encontrar o documento mais próximo. Busca = similaridade semântica exata no Cubo do projeto. O Cube Memory varre cada vetor e devolve o vizinho exato — 100% recall, sem nunca esquecer o estado.

Face FRONT
Tópico Principal
Face BACK
Entidade / Domínio
Face UP
Tempo / Urgência
Face DOWN
Sentimento / Tom
Face LEFT
Campo / Escala
Face RIGHT
Cultura / Modalidade
Da Projeção à Coordenada Exata
A equação completa
54 quadrados+6 faces=60 âncoras
54 quadrados = 6 faces × 9 casas = âncoras semânticas
cada casa = 1 âncora semântica (tópico, entidade, tempo…)
6 faces = 1 eixo identificador por face = estrutura geométrica
front=tópico, back=domínio, up=tempo, down=sentimento, left=campo, right=cultura
Onde a magia acontece:
O isolamento por Cubos Multi-Tenant (1 índice por projeto) garante segurança e privacidade total dos dados. Na hora da busca, o motor resolve a similaridade com precisão absoluta, garantindo 100% de recall real sem as penalidades de bancos de dados genéricos.

Stack Técnico Real — 4 Inovações

Pipeline completo — texto → semântica → resultado exato
textoEncoder SemânticoRepresentação VetorialCubo do ProjetoBusca ExataResultado 100% Preciso
vetorização semântica 384D ·busca exata por similaridade ·compressão 4× no Basic ·100% recall garantido
⚙️

CubeEncoder — Motor de Embeddings

Encoder semântico denso de alta performance. Vetoriza textos com latência mínima e throughput industrial, 100% em CPU.

Dimensões384D
Execução100% CPU · sem GPU
Performance169.228 enc/s
Latênciasub-milissegundo
🎯

Busca Exata — 100% Recall

Motor de busca exata por similaridade semântica. Sem aproximações, sem perda de resultados relevantes — cada consulta retorna o vizinho real.

Tipo de buscaexata · sem aproximação
Recall100% garantido
Latência~28.7ms
Isolamento1 índice por projeto

Cubos Isolados Multi-Tenant

Cada projeto tem seu próprio Cubo de dados. A busca roda exclusivamente no universo do seu tenant — isolamento total, sem vazamento entre clientes, sem perda de recall.

Isolamento1 Cubo por projeto
Busca filtrada100% recall garantido
Vazamento entre tenantsimpossível
Latênciasub-milissegundo
💾

Persistência mmap Zero-Copy

Índices memory-mapped com carga sob demanda e evicção LRU: a RAM fica ancorada apenas nos tenants ativos, sustentando milhares de cubos isolados num servidor pequeno.

Cargammap zero-copy · lazy load
RAM residentesó tenants ativos (LRU)
Precisãocosseno exato
Cold-startreload do disco sob demanda

O único banco onde seu dado vive no ponto exato.

A única solução com 7 propriedades únicas verificadas, benchmarkadas e protegidas por patente.

🚀

GPU 100% Livre para o LLM

Busca semântica roda 100% na CPU. Seu LLM (LLaMA, Mistral, DeepSeek) tem toda a VRAM e GPU disponíveis — sem divisão, sem context switch, sem OOM.

🎯

Busca Exata — Zero Aproximação

Motor de busca semântica exata. Você nunca perde o resultado certo: é o fim das alucinações de RAG causadas por recall aproximado falho.

💾

Persistência mmap Zero-Copy

Índices memory-mapped com carga sob demanda e evicção LRU. A RAM fica ancorada só nos tenants ativos — milhares de cubos isolados num servidor pequeno.

🔐

Zero-Knowledge Architecture

Seus dados são cifrados com AES-256-GCM usando uma chave derivada da sua API key via PBKDF2 (260k iter). O servidor nunca vê seus dados em claro — nem nós mesmos. É a mesma arquitetura do 1Password.

💾

100% de Recall Garantido

Busca exaustiva exata: o documento certo sempre aparece. A solução definitiva contra alucinações de RAG por busca aproximada.

🌐

Busca Semântica sem GPU

Encoder semântico denso de alta performance. Vetoriza textos com latência mínima e throughput industrial, 100% em CPU.

🧠

PKM Notes — Segundo Cérebro com IA

Editor automático por heading, auto-conexões semânticas e comando /vincular para backlinks inteligentes. Seu vault, buscável por qualquer LLM.

🔌

MCP Nativo — Qualquer IA Conecta

Claude Code, Cursor, Windsurf e qualquer LLM via Model Context Protocol. Um comando conecta sua IA ao Cube Memory — sem código, sem configuração local.

P2P Swarm — Zero Servidor

Arquitetura descentralizada. Cada nó carrega o índice binário (8MB/1M docs). Busca semântica offline em dispositivos de borda sem infraestrutura cloud.

Playground Geométrico (Live)

Veja a codificação e os sentinelas passivos acontecendo em tempo real. Motor: CubeEncoder

CUBE MEMORY GEOMETRIC ENCODER
Geometric Address0x0000000000000000
Active Inativo
Digite para pesquisar em tempo real no Omnibus...
FRONT
Topic
BACK
Entity
RIGHT
Culture
LEFT
Field
UP
Time
DOWN
Sentiment
STRUCTURAL HONEYPOT CRYPTOGRAPHY

■ Purple = active bits (carry semantic signal)
□ Red = sentinel bits (passive traps — access triggers alert)

🛡️ Passive Honeypot Map

Simulate Hacker Probe

Click any red sentinel bit above to simulate an intrusion.

44.4%
Detection / attempt
99.957%
After 10 attempts
NOVO — PKM NOTES

Seu Segundo Cérebro.
Agora com 100% de Recall.

Escreva, conecte e busque suas notas com a mesma tecnologia vetorial que alimenta os maiores sistemas de IA do mundo.

cubememory.com.br/dashboard → Notes
NOTAS
Arquitetura CMLSR
score 0.94 · Algoritmo
Zero-Knowledge Auth
score 0.87 · Segurança
PKM Notes — Editor
score 0.82 · Editor
Arquitetura CMLSR
## Algoritmo
Busca exata. Performance de 0.068ms @ 100K vetores. Recall 100%.
## Segurança
AES-256-GCM com DEK por projeto. [Zero-Knowledge Auth]
🧠 Conexões detectadas pela IA
[Zero-Knowledge] 91%[Deploy] 84%
📦
Chunking por Heading
Notas longas são automaticamente quebradas em seções (H1/H2/H3), cada uma com seu próprio embedding. A busca semântica acerta a seção exata, não a nota inteira.
🧠
Auto-Conexões por IA
Ao salvar, o motor varre o vault e detecta notas conceitualmente próximas (score ≥ 0.82). As conexões aparecem no rodapé do editor — sem você precisar organizar nada.
🔗
/vincular — Backlinks Semânticos
Digite /vincular ou clique no botão. Busca semântica mostra as notas mais relevantes por conceito. Selecione para inserir [link] no cursor — conexões guiadas por vetores, não por texto.
🔌
MCP: Qualquer LLM Acessa Suas Notas
Claude, GPT, Gemini, modelos locais — todos acessam seu vault via MCP com search_notes e get_note. Suas notas viram contexto para qualquer IA.
Criar vault gratuito →
🔐
Zero-Knowledge Architecture
Seus dados são cifrados com AES-256-GCM usando uma chave derivada da sua API key — nem nós conseguimos ler seus vetores. A mesma arquitetura do 1Password.
PBKDF2-SHA256
260k iterações
AES-256-GCM
por projeto
DEK isolado
zero acesso servidor
MODEL CONTEXT PROTOCOL

Um comando. Qualquer IA. Memória infinita.

O Cube Memory é o único banco vetorial com MCP HTTP nativo. Conecte Claude Code, Cursor, Windsurf ou qualquer LLM sem instalar nada localmente.

# .mcp.json — zero configuração local
{
  "mcpServers": {
    "cube-memory": {
      "type": "http",
      "url": "https://cubememory.com.br/gateway/v1/mcp",
      "headers": {
        "Authorization": "Bearer <SUA_API_KEY>",
        "X-Project-Id": "<SEU_PROJECT_ID>"
      }
    }
  }
}
Claude CodeCursorWindsurfVS CodeZedGPTGeminiLlama
SDK & CLI

Integre em qualquer linguagem

SDKs oficiais para JavaScript/TypeScript e Python. CLI para terminal. CDN para browser. Tudo com a mesma API.

📦 npm install
JavaScript / TypeScript
$ npm install @cubememory/sdk
import { createCubeClient } from '@cubememory/sdk';
const cube = createCubeClient(url, apiKey);
const results = await cube.index('docs').search('query');
Ver documentação →
🐍 pip install
Python
$ pip install cubememory
from cubememory import CubeClient
cube = CubeClient(url, api_key, project_id)
results = cube.index('docs').search('query')
Ver documentação →
⌨️ CLI Global
Terminal
$ npm install -g @cubememory/cli
cube config set --key cm_live_xxx
cube index search my-docs "wireless headphones"
cube memory store "User prefers dark mode"
Ver documentação →
CDN: <script src="https://cubememory.com.br/sdk.js"></script>

Preços Escaláveis e Transparentes

Escolha o plano ideal para a sua arquitetura neural descentralizada.

Free

$0/month

For personal exploration and local development environments.

  • 100K vetores
  • Busca semântica exata
  • PKM Notes (vault básico)
  • MCP HTTP nativo
  • Chunking por heading
  • Auto-conexões IA
Get Free Key
MOST POPULAR

Starter

$20/month

Perfect for startups and small developer teams building apps.

  • 1M vetores
  • 384D — 100% recall
  • PKM Notes completo
  • Chunking por heading ✨
  • Auto-conexões IA ✨
  • Zero-Knowledge encryption
Start Starter Tier

Pro

$99/month

For heavy workloads requiring low-latency production limits.

  • 10M vetores
  • Engine Pro (latência ultra-baixa)
  • PKM Notes ilimitado
  • /vincular + auto-conexões IA ✨
  • Zero-Knowledge + DEK isolado
  • Priority 24/7 Support
Start Pro Tier

Enterprise

Custom

For organizations requiring offline scale, SLAs, and support.

  • Unlimited local searches
  • Self-hosted custom server
  • All endpoints included
  • Custom semantic faces
  • Guaranteed SLA + Support
  • Source code audit license
Contact Us