Numerai Data Science Pipeline

A modular, production-ready pipeline for the Numerai data science contest. The architecture separates concerns into distinct modules: only you write the model, everything else is fixed and reusable.

Project Structure

numer/
├── __init__.py              # Package initialization
├── config.py                # Configuration management (dataclass)
├── data.py                  # Data loading & caching
├── models.py                # Model registry & factory
├── pipeline.py              # Training pipeline orchestration
├── evaluate.py              # Evaluation metrics
├── submission.py            # Submission handling
├── utils.py                 # Model persistence utilities
├── main.py                  # CLI entry point
├── pyrightconfig.json       # Type checking configuration
└── README.md                # This file

Quick Start

Installation

pip install numerapi xgboost scikit-learn pandas

Train & Submit

# Train and immediately submit predictions
python main.py --mode train-submit --model ridge --data-version v5.2

# Only train (save model)
python main.py --mode train --model xgboost

# Only submit with latest model
python main.py --mode submit --model ridge

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
evaluate_models		evaluate_models
logs		logs
models		models
numer.egg-info		numer.egg-info
train_models		train_models
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
config.py		config.py
data.py		data.py
environment.yml		environment.yml
evaluate.py		evaluate.py
file_layout.txt		file_layout.txt
get_pickle.py		get_pickle.py
play.ipynb		play.ipynb
pyproject.toml		pyproject.toml
pyrightconfig.json		pyrightconfig.json
submission.py		submission.py
submit.py		submit.py
submit.sh		submit.sh
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Numerai Data Science Pipeline

Project Structure

Quick Start

Installation

Train & Submit

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Numerai Data Science Pipeline

Project Structure

Quick Start

Installation

Train & Submit

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages