MFCS Memory

MFCS Memory is an intelligent conversation memory management system that helps AI assistants remember conversation history with users and dynamically adjust response strategies based on conversation content.

Key Features

Intelligent Conversation Memory: Automatically analyzes and summarizes user characteristics and preferences
Vector Storage: Uses Qdrant for efficient similar conversation retrieval
Session Management: Supports multi-user, multi-session management
Automatic Chunking: Automatically creates chunks when conversation history exceeds threshold
Async Support: All operations support asynchronous execution
Extensibility: Modular design, easy to extend and customize
Automatic LLM-based Analysis: User memory and conversation summary are updated automatically at configurable intervals

Core Modules

user_memory/base.py: Base memory management, handles shared resources
user_memory/memory_manager.py: Main entry for memory management, orchestrates all modules and async tasks
user_memory/session_manager.py: Handles session creation, update, chunking, and analysis task management
user_memory/conversation_analyzer.py: Analyzes conversation content and user profile using LLM (OpenAI API)
user_memory/vector_store.py: Manages vector storage and retrieval for conversation history
rag/rag_manager.py: Manages retrieval-augmented generation and vector-based information retrieval
rag/vector_stores/base.py: Base vector store implementation
rag/vector_stores/qdrant_store.py: Qdrant-specific vector store implementation
utils/config.py: Loads and validates all configuration from environment variables

Core Features

MemoryManager Core Methods

get(memory_id: str, content: Optional[str] = None, top_k: int = 2) -> str
- Get current session information for specified memory_id
- Includes conversation summary and user memory summary
- Supports content-based relevant historical conversation retrieval (vector search)
- Returns formatted memory information
update(memory_id: str, content: str, assistant_response: str) -> bool
- Automatically gets or creates current session for memory_id
- Updates conversation history
- Automatically updates user memory summary every 3 rounds (LLM analysis)
- Automatically updates session summary every 5 rounds (LLM analysis)
- Automatically handles conversation chunking and vector storage
- All analysis tasks run asynchronously and are recoverable on restart
delete(memory_id: str) -> bool
- Deletes all data for specified memory_id (session + vector store)
- Returns whether operation was successful
reset() -> bool
- Resets all memory records (clears all session and vector data)
- Returns whether operation was successful

Memory Implementation Details

Context Types and Management

MFCS Memory supports multiple levels of context management to provide intelligent and adaptive conversation tracking:

Short-term Memory (Session Context)
- Maintains the immediate conversation history
- Stores recent interactions within a single session
- Configurable via MAX_RECENT_HISTORY (default: 20 interactions)
- Enables quick retrieval of recent conversation context
Long-term Memory (User Profile)
- Builds a comprehensive user profile across multiple sessions
- Analyzes user preferences, communication patterns, and key characteristics
- Automatically updated every 3 conversation rounds using LLM analysis
- Supports personalized and context-aware responses
Vector-based Semantic Memory
- Utilizes Qdrant vector database for semantic similarity search
- Converts conversation chunks into high-dimensional embeddings
- Enables intelligent retrieval of contextually relevant past conversations
- Supports content-based memory lookup with configurable top_k results

Memory Management Principles

Automatic Context Analysis

Leverages Language Models (LLM) for intelligent context understanding
Performs automatic summarization and key information extraction
Asynchronous analysis to minimize performance overhead

Chunking and Storage Strategy

Automatically splits long conversation histories into manageable chunks
Configurable CHUNK_SIZE (default: 100 conversations per chunk)
Ensures efficient storage and retrieval of extensive conversation data

Semantic Embedding Process

Uses advanced embedding models (default: BAAI/bge-large-zh-v1.5)
Converts text into 768-dimensional vector representations
Enables semantic search and similarity-based memory retrieval

Advanced Memory Features

Multi-session Tracking
- Supports multiple user sessions with unique memory_id
- Maintains isolated yet interconnected memory contexts
Asynchronous Memory Operations
- All memory-related tasks run asynchronously
- Supports task recovery and restart
- Minimizes performance impact during conversation
Extensible Memory Backends
- Modular design allows easy integration of different vector stores
- Current implementation supports Qdrant
- Flexible configuration for embedding models and storage backends

Use Cases

Personalized AI assistants
Contextual chatbots
Intelligent customer support systems
Adaptive learning platforms

Performance Considerations

Configurable concurrent analysis tasks (MAX_CONCURRENT_ANALYSIS, default: 3)
Efficient vector storage and retrieval
Low-latency memory access
Scalable architecture supporting multiple users and sessions

Installation

Install the package:

pip install mfcs-memory

Install SentenceTransformer for text embedding:

pip install sentence-transformers

Note: The default embedding model is BAAI/bge-large-zh-v1.5. You can change it in the configuration.

Quick Start

Create a .env file and configure necessary environment variables:

# MongoDB Configuration
MONGO_USER=your_username
MONGO_PASSWD=your_password
MONGO_HOST=localhost:27017

# Qdrant Configuration
QDRANT_URL=http://127.0.0.1:6333

# Model Configuration
EMBEDDING_MODEL_PATH=./model/BAAI/bge-large-zh-v1.5
EMBEDDING_DIM=768
LLM_MODEL=qwen-plus-latest  # Default value

# OpenAI Configuration
OPENAI_API_KEY=your_api_key
OPENAI_API_BASE=your_api_base  # Optional

# Other Configuration
MONGO_REPLSET=''  # Optional, if using replica set
MAX_RECENT_HISTORY=20  # Default value
CHUNK_SIZE=100  # Default value
MAX_CONCURRENT_ANALYSIS=3  # Default value

Usage Example:

import asyncio
from mfcs_memory.utils.config import Config
from mfcs_memory.user_memory.memory_manager import MemoryManager

async def main():
    # Load configuration
    config = Config.from_env()
    
    # Initialize memory manager
    memory_manager = MemoryManager(config)
    
    # Update conversation
    await memory_manager.update(
        "memory_123",
        "Hello, I want to learn about Python programming",
        "Python is a simple yet powerful programming language..."
    )
    
    # Get memory information
    memory_info = await memory_manager.get(
        "memory_123",
        content="How to start Python programming?",
        top_k=2
    )
    
    # Delete memory data
    await memory_manager.delete("memory_123")
    
    # Reset all data
    await memory_manager.reset()

if __name__ == "__main__":
    asyncio.run(main())

Project Structure

src/
├── mfcs_memory/
│   ├── user_memory/
│   │   ├── base.py                # Base memory management
│   │   ├── memory_manager.py      # Memory manager (main logic)
│   │   ├── session_manager.py     # Session manager (session, chunk, task)
│   │   ├── conversation_analyzer.py # Conversation analyzer (LLM)
│   │   ├── vector_store.py        # Vector store for conversation history
│   │   └── __init__.py
│   ├── rag/
│   │   ├── rag_manager.py         # Retrieval-Augmented Generation manager
│   │   └── vector_stores/
│   │       ├── base.py            # Base vector store
│   │       └── qdrant_store.py    # Qdrant-specific vector store
│   ├── utils/
│   │   ├── config.py              # Configuration management
│   │   └── __init__.py
│   └── __init__.py
├── example/                       # Example code
├── model/                         # Model directory
├── setup.py                       # Installation config
├── .env.example                   # Environment file example
└── README.md                      # Project documentation

Configuration Guide

Required Configuration

MONGO_USER: MongoDB username
MONGO_PASSWD: MongoDB password
MONGO_HOST: MongoDB host address
QDRANT_URL: Qdrant url address
EMBEDDING_MODEL_PATH: Model path for generating text vectors
EMBEDDING_DIM: Vector dimension
OPENAI_API_KEY: OpenAI API key
OPENAI_API_BASE: OpenAI API base URL (Optional)
LLM_MODEL: LLM model name

Optional Configuration

MONGO_REPLSET: MongoDB replica set name (if using replica set)
QDRANT_PORT: Qdrant port number (default: 6333)
MAX_RECENT_HISTORY: Number of recent conversations kept in main table (default: 20)
CHUNK_SIZE: Number of conversations stored in each chunk (default: 100)
MAX_CONCURRENT_ANALYSIS: Maximum number of concurrent analysis tasks (default: 3)

Contributing

Issues and Pull Requests are welcome!

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
example		example
model		model
src/mfcs_memory		src/mfcs_memory
.evn.example		.evn.example
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
README_zh.md		README_zh.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MFCS Memory

Key Features

Core Modules

Core Features

MemoryManager Core Methods

Memory Implementation Details

Context Types and Management

Memory Management Principles

Automatic Context Analysis

Chunking and Storage Strategy

Semantic Embedding Process

Advanced Memory Features

Use Cases

Performance Considerations

Installation

Quick Start

Project Structure

Configuration Guide

Required Configuration

Optional Configuration

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MFCS Memory

Key Features

Core Modules

Core Features

MemoryManager Core Methods

Memory Implementation Details

Context Types and Management

Memory Management Principles

Automatic Context Analysis

Chunking and Storage Strategy

Semantic Embedding Process

Advanced Memory Features

Use Cases

Performance Considerations

Installation

Quick Start

Project Structure

Configuration Guide

Required Configuration

Optional Configuration

Contributing

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages