Google CALM: Nowa technologia rewolucjonizująca modele językowe
Google CALM: Nowa technologia rewolucjonizująca modele językowe
Google ogłosił przełomową technologię o nazwie CALM, która przyspiesza działanie dużych modeli językowych (LLM) takich jak GPT-3 i LaMDA, nie wpływając na poziom ich wydajności.
Większe zbiory danych treningowych są lepsze, ale mają swoją cenę. Duże modele językowe uczą się na podstawie ogromnych ilości danych. Trening modeli językowych na większych zbiorach danych skutkuje nabywaniem nowych umiejętności, które nie zawsze były planowane. Na przykład, dodanie większej ilości danych do modelu językowego może nieoczekiwanie zaowocować zdolnością do tłumaczenia między różnymi językami, mimo że nie był on do tego trenowany.
Te nowe umiejętności nazywane są emergent abilities, czyli zdolnościami, które nie są koniecznie planowane. W innym badaniu na temat emergent abilities stwierdzono, że "choć istnieje wiele przykładów takich zdolności, obecnie jest niewiele badań dotyczących ich zrozumienia."
Na podstawie: Źródła








