Udemy線上課程 (Ken Cen出品)Generative AI第18部 如何訓練DeepSeek大語言模型 講師:Ken Cen 影音教學 中文發音 繁體中文(DVD版)
		
Udemy線上課程 (Ken Cen出品)Generative AI第18部 如何訓練DeepSeek大語言模型 講師:Ken Cen 影音教學 中文發音 繁體中文(DVD版)
內容說明:
掌握AI未來:用Python代碼拆解DeepSeek-R1,開啟低成本大模型訓練之旅——從理論到實踐,手把手教你成為下一代AI開發者
DeepSeek-R1:一場全球AI競賽的顛覆性突破
2025年初,中國AI企業DeepSeek憑借開源模型DeepSeek-R1震撼全球,其性能與OpenAI的頂級推理模型o1旗鼓相當,但成本僅為後者的1/40!這一突破不僅讓亞馬遜、
微軟等科技巨頭爭相接入,更引發美國政界與科技界的雙重震動
課程包括內容:
DeepSeek的發展與技術特點(DeepSeek V1, DeepSeek V2, DeepSeek V3, DeepSeek R1-Zero, DeepSeek R1, )神經網絡Neural Networks的組成和原理前饋神經網絡的原理&數據加載(輸入層,隱藏層, Soft
Max,Logits,激活函數,輸出層)如何用Python訓練前饋神經網絡(tensor, epoch)什麼是Transformer & Attention & MHA & GQA & MQA(Transformer, Attention, Positional Embedding)什麼是MLA & RoPE & MoE用Python編寫MLA的各層和結構如何添加RotaryEmbedding到MLA如何用Python編寫混合專家架構如何實現訓練和編寫DeepSeekModel如何實現 Transformer(Encoder, Decoder)
課程內容:
01 - 介紹
001 課程工具準備.mp4
002 如何安裝和使用包管理器.mp4
003 Windows安裝使用Poetry的方法.html
02 - Deepseek V1
001 DeepSeek的發展與技術特點.mp4
002 神經網絡Neural Networks的組成和原理.mp4
003 前饋神經網絡的原理&數據加載.mp4
004 如何用Python訓練前饋神經網絡.mp4
03 - DeepSeek V2
001 什麼是Transformer & Attention & MHA & GQA & MQA.mp4
002 什麼是MLA & RoPE & MoE.mp4
003 用Python編寫MLA的各層和結構.mp4
004 如何添加RotaryEmbedding到MLA.mp4
005 如何用Python編寫混合專家架構.mp4
006 如何實現訓練和編寫DeepSeekModel.mp4
04 - Transformer
001 如何編寫多頭注意力機制.mp4
002 如何編寫Positional Encoding - 位置編碼.mp4
003 如何編寫Transformer 的編碼器和解碼器.mp4
004 如何實現Transformer的訓練和評估.mp4
											
						
									
								
								
							
							  
站內搜索
購物車
			
			
			
			
		
	
	熱門關鍵字
	
		
			
51job 
前程無憂 
Frank 
學院 
Qingming 
Wpf詳解 
Zhao 
工作效率 
女性領導力 
三節課 
下篇 
六卦詳解 
王思迅 
文富 
打造獨角獸 
光佑 
有個小院 
行銷 
東東 
東東好課 
佳旋 
易經開門課 
的環境預備 
若水 
美伊 
思迅 
星空 
面對痛苦 
渡人渡己 
紫微篇 
資承 
遍路文化 
漢化課程 
養心 
養身 
養神 
編程入門 
養體 
霍大俠 
觸發器