Regla de la cadena calculo vectorial

Regla de la cadena

Si se siente cómodo formando matrices de derivadas, multiplicando matrices y utilizando la regla de la cadena de una variable, entonces el uso de la regla de la cadena \eqref{general_chain_rule} no requiere memorizar una serie de fórmulas y determinar qué fórmula se aplica a un problema dado.

Por otro lado, disponer de algunas fórmulas de casos especiales puede ahorrar algo de trabajo. Para un tipo de problema dado, se pueden formar las matrices y calcular su producto una vez para obtener una fórmula válida para ese tipo de problema en particular.

Problemas prácticos de la regla de la cadena multivariable

En teoría de la probabilidad, la regla de la cadena (también llamada regla del producto general[1][2]) permite calcular cualquier miembro de la distribución conjunta de un conjunto de variables aleatorias utilizando sólo probabilidades condicionales. La regla es útil en el estudio de las redes bayesianas, que describen una distribución de probabilidad en términos de probabilidades condicionales.

->  Que es el wushu

Esta regla se ilustra en el siguiente ejemplo. La urna 1 tiene 1 bola negra y 2 blancas y la urna 2 tiene 1 bola negra y 3 blancas. Supongamos que elegimos una urna al azar y luego seleccionamos una bola de esa urna. Dejemos que el evento

(A_{1}cap A_{2}cap A_{3}cap A_{4})&=mathrm {P} (A_{4}mid A_{3}cap A_{2}cap A_{1})\cdot \mathrm {P} (A_{3}cap A_{2}cap A_{1})&=mathrm {P} (A_{4}mid A_{3}cap A_{2}cap A_{1})\Ny=mathrm {P} (A_{3}mid A_{2}cap A_{1})\cdot \mathrm {P} (A_{2}cap A_{1})&=mathrm {P} (A_{4}mid A_{3}cap A_{2}cap A_{1})\Ny=mathrm {P} (A_{3}mid A_{2}cap A_{1})\cdot \mathrm {P} (A_{2}mid A_{1})\Nmathrm {P} (A_{1})\end{aligned}}}

Ejemplos de reglas de cadena multivariables

(Enseñamos en el programa MS in Data Science de la Universidad de San Francisco y tenemos otros proyectos nefastos en marcha. Puede que conozcas a Terence como el creador del generador de parser ANTLR. Para obtener más material, consulte los cursos fast.ai de Jeremy y la versión presencial del curso de aprendizaje profundo del Instituto de Datos de la Universidad de San Francisco).

Este artículo es un intento de explicar todo el cálculo matricial que necesitas para entender el entrenamiento de las redes neuronales profundas. Asumimos que no hay conocimientos de matemáticas más allá de lo que aprendiste en cálculo 1, y proporcionamos enlaces para ayudarte a refrescar las matemáticas necesarias cuando sea necesario. Ten en cuenta que no necesitas entender este material antes de empezar a aprender a entrenar y utilizar el aprendizaje profundo en la práctica; más bien, este material es para aquellos que ya están familiarizados con los fundamentos de las redes neuronales, y desean profundizar su comprensión de las matemáticas subyacentes. No te preocupes si te quedas atascado en algún punto del camino – simplemente vuelve a leer la sección anterior, e intenta escribir y trabajar con algunos ejemplos. Y si sigues atascado, estaremos encantados de responder a tus preguntas en la categoría de Teoría en forums.fast.ai. Nota: Hay una sección de referencia al final del documento que resume todas las reglas clave del cálculo matricial y la terminología discutida aquí.

->  Enfoque del español primaria

Prueba de la regla de la cadena multivariable

Combinando los términos con el mismo valor de m1 + m2 + …  + mn = k y notando que mj tiene que ser cero para j > n – k + 1 conduce a una fórmula algo más sencilla expresada en términos de los polinomios de Bell Bn,k(x1,…,xn-k+1):

que va con ella corresponde al hecho de que hay tres sumandos en esa partición. El coeficiente 6 que va con esos factores corresponde al hecho de que hay exactamente seis particiones de un conjunto de cuatro miembros que lo rompen en una parte de tamaño 2 y dos partes de tamaño 1.

{\displaystyle {\begin{aligned}&\frac {D^{1}(f\circ {}g)}{1!}}&=\left(f^(1)}\circ {}g\right){\frac {\frac {g^(1)}{1!}}[8pt]&\frac {D^{2}(f\circ g)}{2! izquierda(f^(1)}circ g)}derecha){\frac {\frac {g^(2)}{2!}}{1!}}+left(f^(2)}circ g)} {\frac {\frac {g^(1)}{1! [8pt]& {{frac} {D^3}(fcirc g)}{3!}}&=left(f^(1)}circ {}g\\right){{frac} {{g^(3)}{3!}} izquierda(f^(2)}circ {}g\a la derecha){\frac {\frac {g^(1)}{1!}} {\frac {g^(2)}{1!}&}+izquierda(f^(3)}circ {}g\a la derecha){\frac {\frac {g^(1)}{1! {\frac {g^(1)}{1!}}{\frac {g^(1)}{1!}}[8pt]&{\frac {D^{4}(f\circ g)}{4!}&=left(f^(1)}{circ}{g\right){\frac {\frac {g^(4)}{4! {{1!}}&}+{{}left(f^(2)}{circ} {}g\right)}{{}left({{frac} {g^(1)}{1!}}{{1!}}{{frac} {g^(3)}{3!}{1!}}+{{{{frac} {g^(2)}{2! derecha)&{}+left(f^(3)}circ{}g\a la derecha){{frac} {{g^(1)}{1!}}{frac} {g^(1)}{1!}{2!}} { {{frac}} {{1!}}&{}+left(f^{4)} {{circ}} {{directo}} {{frac}} {g^(1)}{1!}}{frac} {g^(1)}{1!}}{frac} {g^(1)}{1!}}{frac} {g^(1)}{4!}}end{aligned}}.

Esta web utiliza cookies propias para su correcto funcionamiento. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad