SuzyHelpdesk — это система для автоматизированной обработки PDF-документов, их разбиения на части, создания векторного хранилища с помощью моделей HuggingFace и интеллектуального поиска по содержимому с использованием LangChain и LangGraph.
- Загрузка и разбиение PDF-документов на смысловые части
- Векторизация текста с помощью моделей HuggingFace
- Хранение эмбеддингов в FAISS
- Интеллектуальный поиск и извлечение информации
- Гибкая архитектура на основе графа агентов (LangGraph)
- Логирование и визуализация процессов
-
Клонируйте репозиторий:
git clone https://github.com/Kairatzh/SuzyHelpdesk.git cd SuzyHelpdesk -
Создайте и активируйте виртуальное окружение:
python -m venv .venv .venv\Scripts\activate
-
Установите зависимости:
pip install -r requirements.txt
-
Запустите основной агент:
python -m src.agent
from src.preprocess_docs import Preprocess
doc_path = "your_doc.pdf"
preprocessor = Preprocess(doc_path)
chunks = preprocessor.chunk()
vector_store = preprocessor.embedder(chunks)
preprocessor.save_vector_store(vector_store, path="vector_store")src/
│
├── agent.py # Граф агентов и запуск
├── preprocess_docs.py # Обработка и векторизация документов
├── inference.py # Инструменты для работы с LLM и поиском
├── routers.py # Роутеры для графа
├── retriever.py # Поиск по векторному хранилищу
├── utils/
│ ├── logging.py # Логирование
│ └── states.py # Описание состояния
└── ...
- Python 3.10+
- LangChain
- LangGraph
- HuggingFace Transformers
- FAISS
MIT License
Проект находится в активной разработке. Будем рады вашим вопросам