Sonraki birkaç video SLM'lerin ince ayarıyla ilgili olacak. ❤️ 🔥 - Başlangıçta ön eğitimden sonra model geliştirme işini kapsayan 60 dakikalık bir video istiyordum (CPT, Midtraining, SFT, RLHF, RLVR) - Ama bu aylar sürer, bu yüzden bunun yerine ~20 dakikalık bir mini seri yapıyorum. - Gerekirse biraz HF ve Pytorch ile tembelliği azaltın. Gerçek hayatta olan kısım Prime Labs kullanacak. - Kod bir yana, ana odak veri setleri olacak. işletim sistemi veri setlerini tanımlamak, onları hazırlamak, eğitim için sentetik veri setleri oluşturmak vb - Bir diğer ana dal değerlendirme olacak. Metrikler için koşumlar kurmak. - Sonraki videoların konuları henüz tam olarak planlanmamış, ekran görüntüsünü temel yol haritası olarak görüyorum. Sizden gelen sorulara göre durumu göz önünde bulunduracağım! - Kesinlikle arada başka videolar üzerinde çalışacağım. Aklım başka yerlere giderse, bırakırım. Ama umarım önümüzdeki 3 ay içinde bitiririm. Her şey benim keyfime bağlı, dünyada neler olup bittiğine ve izleyicimin neyle ilgilenmek istediğine bağlı. Bununla birlikte, bir sonraki videom %100 özel veri setlerinde devam eden ön eğitimle ilgili olacak.