Transformer

Category: Language Models

Framework: PyTorch

Dataset: Custom

Created: March 10, 2025

GitHub: View Implementation

Overview

From scratch implementation of Transformer

I implemented the Vanilla Transformers using Pytorch on the German-English dataset.

Multi30k de-en: Link

Pytorch

Training epochs: 3 Val epochs: 5

Train loss: 0.02 (mean) Val loss: 0.03 (mean)

📁 GitHub Repository: Transformer

View the complete implementation, training scripts, and documentation on GitHub.