DeepSeek с отворен код нов модел V3.1 · TechNode
На 20 август DeepSeek обяви отворения код на новия си модел V3.1-Base на Hugging Face. Според компанията моделът има приблизително 685 милиарда параметъра, а дължината на контекста му е разширена до 128K. По-рано същата вечер…