Machine learning resources

Online resources : dataloop 📑 huggingface

Coding assistants : Windsurf vs-code plugin ⛽ Refact.ai 🏮 codeconvert 🛫

APIs : Anthropic API 📡 Google GenAI ⛅ OpenAI-python …

LLMs : OLlama 🐕 Whisper 🎤 Gemma ˀ 💎 SpaCy 🖥️

Light LLMs : litgpt 🤖 pythia 🤖 TinyLlama 🤖 NanoGPT-128Mˀ

Physics : PhysicsNeMo 🔯 ( e.g. Fourier darcy_fno )

Geophysics : SPADE-Terrain-GAN 🌏 ada_multigrid_ppo

Training : Lookahead 🎯 Gymnasium 👯

Distributed training : NCCL 📿 GLOO 📿 MPI 📿 ˀ

ML deployment : llama.cpp 📦 Pytorch 🢚 onnx 📦 jax onnx runtime 🧊 MLflowˀ

UI : ComfyUI 🎨

Datasets : VQA👇 🌄 WeatherBench 📸 COCOˀ 📷 FineWebˀ

VQA

Computational costs, based on F.G.Raeini’s MSc, Per batch size of 128, GPU: N100, CPU: AMD 5700U

Model	Num-Params	size (MB)	Inf time (GPU)	Train-time CPU!	Acc. VQAv1/2,AOK
ViLT	82M	470	2 s	25 s	72%, 44%
ResAttLSTM		80		2.5 s	62%, 30%

Larger models:

VQA datasets:

dataset	VQA-v2	VQA-v1	AOK-VQA	VizWiz
train, val:	443k, 214k	214k, 121k	17.0k, 1.14k	200k, 40k ˀ