ProFit: Leveraging High-Value Signals in SFT via Probability-Guided Token Selection | Tao Liu et al.

ProFit: Leveraging High-Value Signals in SFT via Probability-Guided Token Selection | Tao Liu et al. | ResearchPod