看板 trans_math 關於我們 聯絡資訊
※ 引述《Edward56 (白面書生段譽 )》之銘言: : 我看不太懂chain rule的證明所使用的概念 既然你的問題出自於 chain rule 的證明, 就談一下這個 證明好了. 設 y=f(x), x=g(t), 所以 y=f(g(t)) The chain rule 說: 若 g 在 t=a 可微, f 在 x=b=g(a) 可微, 則 f(g(t)) 在 t=a 可微, 且 (d/dt)f(g(t)) = f'(g(a))g'(a) 依 "單變數可微就是導數存在" 的結論, 要證明 f(g(t)) 在 t=a 可微, 要考慮的是 Δy/Δt ≡ (f(g(a+Δt))-f(g(a)))/Δt = Δy/Δx.Δx/Δt ≡ (f(g(a+Δt))-f(g(a)))/(g(a+Δt)-g(a)). (g(a+Δt)-g(a))/Δt 在非正式推導時, 就是利用這個關係, 讓 Δt→0 取極限. 然而, 在正式證明中會發現: 這式會發生問題, 因為我們 無法保證 Δt≠0 時 g(a+Δt)≠g(a). 也就是說,上列將 Δy/Δt 表示成 Δy/Δx.Δx/Δt 有可能第一項會出現 "除以 0" 這種不被允許的算式. 因此, 要證明單變數的 chain rule, 有兩個方式, 一是: 將分解式的第一項用另一個函數取代: h(Δt) = f'(g(a)) if g(a+Δt)=g(a) = (f(g(a+Δt))-f(g(a)))/(g(a+Δt)-g(a)) if g(a+Δt)≠g(a) 得 Δy/Δt = h(Δt).Δx/Δt, 而後讓 Δt→0 取極限. 另一種方法可以同時適用於多變數函數, 那就是重新定義 "可微分". 這個新定義對多變數函數同時也適用, 那就是: 將 Δy=f(x+Δx)-f(x) 表示成: Δy = A(x).Δx + ξ(x,Δx).Δx 在定義中考慮的是單點 x, 例如 x=a. 因此可以簡化上式: Δy = A.Δx + ξ(Δx).Δx 其中 A 是常數 (意思是: A 與 Δx 無關). 而 "可微分" 的定義是: 有一個常數 A 使得上列右式中 ξ(Δx)→0 當 Δx→0 很容易證明這個定義 (在單變數實數函數中) 與導數存在 是等價的, 而且符合可微分定義的 A(x)=f'(x). 回到 chain rule, 顯然我們要證明 f(g(a+Δt))-f(g(a)) = f'(g(a))g'(a)Δt+ξ(Δt)Δt 而且 ξ(Δt)→0 當Δt→0. 而我們知道的是 f 在 g(a) 可微以及 g 在 a 可微. 就第一點, 可望得 f(g(a+Δt))-f(g(a)) = f'(g(a))g'(a)(g(a+Δt)-g(a)) + δ.(g(a+Δt)-g(a)) 其中 δ→0 當 g(a+Δt)-g(a)→0. 可是, 前面提過的問題又出現了: 若 g(a+Δt)-g(a) = 0 怎麼辦? 因為考慮 g(a+Δt)-g(a)→0 時的極限必須它不 為 0. 所以, 你所疑惑的 "補點" 定義出現了: 定義 δ(0) = 0. 把這 "補點" 的想法帶回原來的可微分定義中, 就是 Δy ≡ f(a+Δx)-f(a) = f'(a).Δx + ξ(Δx).Δx 其中 ξ(Δx) = (f(a+Δx)-f(a))/Δx - f'(a) 當 Δx≠0 = 0 當 Δx=0 在 f'(a) 存在的前提下, 顯然 lim ξ(Δx) = 0. 因此, Δx→0 如上定義 ξ(0) 使得 ξ 在 0 連續 (並非 ξ 處處連續, 除非 f 本身是處處連續). 由此可知: 上述 ξ(0)=0 的定義, 是在證明 chain rule 時必要的一個小程序, 但不是定義 "可微分" 這概念時必 要的; 至於 ξ 在 0 連續, 只是上述定義的一個小結論, 或者說敘述較方便?其實它並不是很重要---看看如何完成 chain rule 證明, 就知道所謂 "ξ連續" (在以下證明中 用 δ) 這概念是否重要了. [Chain rule 之證明] 設 f(b+Δx)-f(b)=f'(b)Δx+δ(Δx).Δx, δ(0)=0 g(a+Δt)-g(a)=g'(a)Δt+η(Δt).Δt 又: b=g(a), Δx=g(a+Δt)-g(a). 則得: f(g(a+Δt))-f(g(a)) = f'(g(a)).Δx + δ(Δx).Δx = f'(g(a))(g(a+Δt)-g(a))+δ(Δx).Δx = f'(g(a))(g'(a)Δt+η(Δt)Δt)+δ(Δx).Δx = f'(g(a))g'(a).Δt + f'(g(a)).η(Δt).Δt +δ(Δx).(Δx/Δt).Δt = f'(g(a))g'(a).Δt + (f'(g(a)).η(Δt)+δ(Δx).(Δx/Δt)).Δt 取 ξ(Δt) = f'(g(a)).η(Δt)+δ(Δx).(Δx/Δt), 則 f(g(a+Δt))-f(g(a)) = f'(g(a))g'(a).Δt + ξ(Δt).Δt 而 Δt→0 時: (1) η(Δt) → 0, 因此 f'(g(a)).η(Δt) → 0. (2) Δx→0 (或等於0), 因此 δ(Δx)→0 或等於 0; 且Δx/Δt = (g(a+Δt)-g(a))/Δt →g'(a). 故 δ(Δx).(Δx/Δt) → 0. 因此, ξ(Δt)→0, 當 Δt→0. ▌ 注意在 (2) 中考慮了 Δx=0 定義此時 δ(Δx)=0. 我們 可以不談及δ在0連續; 也可以直用 "δ在0連續" 來說明 δ(Δx).(Δx/Δt) → 0 當 Δt→0. -- 嗨! 你好! 祝事事如意, 天天 happy! 有統計問題? 歡迎光臨統計專業版! :) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 我們強調專業的統計方法、實務及學習討論, 只想要題解的就抱歉了! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.41.98.234
BaBi:詳細推~ 36.234.226.200 08/15 12:15
suhorng:推 118.166.46.246 08/15 12:30
goshfju:推 111.251.81.92 08/15 15:35