Notas de Análisis Matemático II
Notas de Análisis Matemático II
Notas de Análisis Matemático II
8 de septiembre de 2020
2020
c Viviana Alejandra Dı́az
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.
1
Índice general
2. Nociones de topologı́a en Rn 10
2.1. Función distancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2. Bolas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3. Conjuntos acotados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Conjuntos abiertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5. Interior de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6. Conjuntos cerrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7. Conjuntos compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.8. Puntos de acumulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.9. Clausura de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.10. Frontera de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.11. Convexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.12. Conexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.13. Arco-conexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2
6. Sucesiones y continuidad 53
6.1. Sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.2. Funciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
8. Integrales múltiples 70
8.1. Integrales en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.1.1. Rectángulos y particiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.1.2. Integral de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.1.3. Dominios generales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.2. Integrales iteradas y teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3. Integrales en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4. Integrales en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.4.1. Medida de una región . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.5. Cambio de variables en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.5.1. Particiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.5.2. Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
8.5.3. Cambio de variables, versión lineal . . . . . . . . . . . . . . . . . . . . . . 84
8.5.4. Cambio de variables, versión general . . . . . . . . . . . . . . . . . . . . . 85
8.6. Cambio de variables en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
9. Integrales curvilı́neas 90
9.1. Orientación de curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
9.2. Integrales de lı́nea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
10.Integrales de superficie 95
10.1. Orientación de superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
10.2. Orientabilidad de superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
10.3. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
10.3.1. Generalización a más dimensiones . . . . . . . . . . . . . . . . . . . . . . . 99
Siempre que un modelo matemático implique la razón de cambio de una variable con res-
pecto de otra, es probable que aparezca una ecuación diferencial. Las ecuaciones diferenciales
surgen en una amplia gama de áreas, no sólo en las ciencias fı́sicas, sino también en campos tan
diversos como la economı́a, la biologı́a, la medicina, la quı́mica, la electrónica, la psicologı́a y la
investigación operativa.
Cuando se plantean en términos matemáticos muchos problemas importantes y significativos
de estas ciencias, se requiere determinar una función que satisfaga una ecuación que contiene una o
más derivadas de la función desconocida. Estas ecuaciones se denominan ecuaciones diferenciales.
Quizás el ejemplo más conocido es la ley de Newton
!
d2 u(t) du(t)
m 2
= F t, u(t), , es decir, F = ma (1.1)
dt dt
para la posición u(t) de una partı́cula sobre la que actúa una fuerza F, que puede ser una función
du(t)
del tiempo t, de la posición u(t) y de la velocidad . Para determinar el movimiento de una
dt
partı́cula sobre la que actúa una fuerza F es necesario hallar una función u(t) que satisfaga la
ecuación (1.1).
Aunque para muchas ecuaciones es posible verificar que ciertas funciones sencillas son so-
luciones, en general no se obtienen con facilidad esas soluciones. Por lo tanto, una pregunta
fundamental es: dada una ecuación de la forma
¿es posible decir si la ecuación tiene una solución? Este es el problema de la existencia de
una solución. El hecho de que se haya escrito una ecuación de la forma (1.2) no necesariamente
significa que exista una función y(x) tal que f (x, y, y 0 , ..., y (n−1) ) − y (n) = 0 se satisfaga. De hecho,
no todas las ecuaciones diferenciales tienen soluciones.
En segundo lugar, suponiendo que una ecuación dada tiene una solución, ¿tendrá otras solu-
ciones? Esta es la cuestión de la unicidad. En caso de que la ecuación tenga más de una solución,
¿qué tipo de condiciones adicionales son necesarias para obtener una solución especı́fica?
Las cuestiones de existencia y unicidad son difı́ciles de responder.
Una tercera pregunta, más práctica, es: dada una ecuación diferencial del tipo de la ecuación
(1.2), ¿cómo se determina realmente una solución? Obviamente, si se encuentra una solución de
la ecuación dada, al mismo tiempo se responde la pregunta de la existencia de una solución.
Por otra parte, aunque fuese posible saber que existe una solución de una ecuación diferencial
4
CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS
(demostrando su existencia sin necesidad de encontrarla), puede ser que ésta no sea expresable
en términos de las funciones elementales usuales: funciones polinomiales, trigonométricas, expo-
nenciales, logarı́tmicas e hiperbólicas. No obstante, esto es lo que sucede para la mayor parte de
las ecuaciones diferenciales. De hecho, una ecuación diferencial puede ser muy compleja y difı́cil
de analizar.
Por ejemplo, puede utilizarse el software libre Geogebra y uno de sus recursos públicos
(https://www.geogebra.org/m/kpp3FjBh) para graficar el campo de velocidades de una ecua-
ción diferencial de primer orden del tipo (1.3).
dy 3−y
Veamos en la figura que sigue el caso del campo direccional de la ecuación =
dx 2
eligiendo, como es usual, una rejilla rectangular de puntos.
3−y
Para esta ecuación, f (x, y) = sólo depende de y, de modo que los segmentos rectilı́neos
2
tienen la misma pendiente en todos los puntos sobre cualquier recta paralela al eje x. Por ejemplo,
sobre la recta y = 2 la pendiente de cada segmento rectilı́neo es 12 .
dy
Cualquier solución de la ecuación general = f (x, y) tiene la propiedad de que, en
dx
todo punto, su gráfica es tangente al elemento del campo direccional en ese punto. Por tanto, a
partir de la observación de los campos direccionales de la ecuación diferencial es posible deducir
el perfil general de las soluciones, es decir, el campo direccional proporciona una información
cualitativa acerca de las curvas solución e incluso de regiones del plano que tienen algún interés
especial.
Por ejemplo, con base en la Figura (1.1) parece evidente que las soluciones son funciones
decrecientes cuando y > 3, que son crecientes cuando y < 3, y que, aparentemente, todas las
soluciones tienden al valor 3 cuando x → +∞.
La interpretación geométrica de la ecuación (1.3) es una familia infinita de curvas, pues
al conocer la derivada de la función solución, conoceremos y(x) a menos de una constante de
integración. A menudo, a estas curvas se les da el nombre de curvas integrales. Algunas veces
es importante elegir un elemento especı́fico de la familia de curvas integrales. Lo anterior se lleva
a cabo al identificar un punto particular (x0 , y0 ) por el que se requiera que pase la gráfica de la
solución. Este requisito suele expresarse como y(x0 ) = y0 y se denomina condición inicial. Una
ecuación diferencial de primer orden, como la (1.3), junto con una condición inicial constituyen
lo que se llama un problema con valor inicial.
Ejercicio: Plantear la ecuación diferencial cuyas soluciones son las curvas tales que en cada
punto (x, y) la pendiente de la recta tangente sea igual al cubo de la abscisa en dicho punto.
1. Graficar con GeoGebra el campo de direcciones de la ecuación diferencial planteada.
2. Hallar analı́ticamente las soluciones de la ecuación diferencial y observar la relación entre
las curvas solución y el campo de direcciones (si puede comentar algo de lo que observa,
coméntelo).
3. ¿Cuál de las curvas solución pasa por el origen?
Se multiplica la ecuación (1.4) por una función µ(x), que por el momento no está determinada.
Entonces, se tiene
µ(x)y 0 + µ(x)p(x)y = µ(x)g(x). (1.6)
El objetivo es elegir µ(x) de modo que el primer miembro de la ecuación (1.6) sea la derivada de
alguna función. El término µ(x)y 0 sugiere que la función deseada (de la que el primer término es
su derivada) podrı́a ser el producto µ(x)y. Una función µ(x) que tenga esta propiedad se llama
factor integrante.
A fin de obtener la combinación (µ(x)y)0 = µ0 (x)y + µ(x)y 0 es necesario sumar y restar el
término µ0 (x)y en el primer miembro de la ecuación (1.6); al hacerlo y agrupar los términos de
manera conveniente, se obtiene
Ahora, si el segundo término del primer miembro de la ecuación (1.7) fuese cero, entonces esta
ecuación tendrı́a la forma
(µ(x)y)0 = µ(x)g(x), (1.8)
y el primer miembro (por lo menos) serı́a fácilmente integrable. A fin de lograr lo anterior, debe
elegirse µ de modo que
µ0 (x) − p(x)µ(x) = 0. (1.9)
µ0 (x)
Si se supone que µ(x) es positiva, entonces la ecuación (1.9) puede escribirse como = p(x),
µ(x)
d Z
o bien ln(µ(x)) = p(x). Por lo tanto, ln(µ(x)) = p(x) dx + k, siendo k la constante de
dx
integración.
Al elegir la constante k como cero, se obtiene la función para µ, a saber
Z R
p(x) dx
µ(x) = exp p(x) dx = e (1.10)
Como y(x) representa cualquier solución de la ecuación (1.5), se concluye que toda solución
de la ecuación (1.5) está incluida en la expresión del segundo miembro de la ecuación (1.11). Por
consiguiente, esta expresión se conoce como solución general de la ecuación (1.5).
Observemos que para encontrar la solución dada por la ecuación (1.11) se requieren dos
integraciones: una para obtener µ(x) a partir de la ecuación (1.10) y otra para determinar y(x)
a partir de la ecuación (1.11). También, observemos que antes de calcular el factor integrante
µ(x) a partir de la ecuación (1.10), es necesario asegurarse de que la ecuación diferencial esté
exactamente en la forma (1.5); especı́ficamente, el coeficiente de y 0 debe ser uno. En caso contrario,
la p(x) usada para calcular µ(x) será incorrecta. En segundo lugar, después de encontrar µ(x) y
multiplicar la ecuación (1.5) por ella, es necesario tener la certeza de que los términos en los que
aparecen y e y 0 son, en efecto, la derivada de µ(x)y, como debe ser.
Por supuesto, una vez que se ha encontrado la solución y(x), también puede verificarse sus-
tituyéndola en la ecuación diferencial.
Una vez conocida la solución general y(x) de la ecuación diferencial dada por la fórmula
(1.11), si se está en presencia de un problema con valor inicial y se tiene, por lo tanto, una
condición inicial que determina el valor de y(x) para un x = x0 en particular, puede obtenerse
el valor de c en (1.11) y la correspondiente solución del problema con valor inicial.
Ejercicio: Determinar la solución del problema con valor inicial y 0 + 2y = e−x con y(0) = 43 .
Aunque es cierto que no toda ecuación diferencial tiene soluciones (por ejemplo, es obvio que
la ecuación diferencial (y 0 )2 + 1 = 0 carece de soluciones reales), las ecuaciones diferenciales que
se encuentran en la práctica tienen, en general, muchas soluciones.
Anteriormente se mostró cómo construir soluciones de una ecuación diferencial lineal de pri-
mer orden con valor inicial, mediante el uso de un factor integrante para cambiar la ecuación
diferencial por una forma integrable. A continuación veremos algunas cuestiones de carácter más
general respecto a las ecuaciones del tipo y 0 + p(x)y = g(x) con valor inicial, intentando
contestar las preguntas:
¿Un problema con valor inicial de este tipo siempre tiene una solución?
¿Es posible que el problema con valor inicial tenga más de una solución?
¿Es válida la solución para todo x ∈ R o sólo para algún intervalo alrededor del punto
donde se tiene la condición inicial?
El teorema que sigue da las condiciones bajo las cuales un problema con valores iniciales de
una ecuación lineal de primer orden siempre tiene una, y sólo una, solución.
Teorema 1.2.1 Si las funciones p(x) y g(x) son continuas en un intervalo abierto α < x < β
que contiene al punto x = x0 , entonces existe una función única y(x) que satisface la ecuación
diferencial
y 0 + p(x)y = g(x) (1.12)
para α < x < β, y que también satisface la condición inicial
y(x0 ) = y0 , (1.13)
donde Z
µ(x) = exp p(x) dx. (1.15)
En la sección anterior se demostró que si la ecuación (1.12) tiene una solución, entonces ésta
debe estar dada por la ecuación (1.14). Al observar con más cuidado esa deducción, también se
puede concluir que la ecuación diferencial (1.12) debe tener una solución.
En efecto, dado que por hipótesis suponemos que p(x) es continua para α < x < β, se
concluye que p(x) está definida en este intervalo y que es una función diferenciable distinta de
cero. Al multiplicar la ecuación (1.12) por µ(x) (que se supone una función derivable para que
exista (µ.y)0 y, por lo tanto, continua) se obtiene
En virtud de que µ(x) y g(x) son continuas en [α, β], la función µ(x)g(x) es integrable en ese
intervalo, y la ecuación (1.14) se deduce de la ecuación (1.16). Además, la integral de µ(x)g(x)
es diferenciable (pues es µ(x).y), de modo que y(x) dada por la ecuación (1.14), existe y es
diferenciable en todo el intervalo [α, β]. Al sustituir la expresión para y(x) dada por la ecuación
(1.14) en la ecuación (1.12) o en la ecuación (1.16), es fácil verificar que esta expresión satisface
la ecuación diferencial en todo el intervalo [α, β]. Por último, la condición inicial (1.13) determina
de manera única la constante de integración c, de modo que existe sólo una solución del problema
con valor inicial, con lo que se completa la demostración.
Observaciones:
El teorema 1.2.1 establece que el problema con valor inicial dado tiene una solución y
también que el problema tiene sólo una solución. En otras palabras, el teorema asegura la
existencia y la unicidad de la solución del problema con valor inicial (1.12), (1.13). Además
establece que la solución existe en toda la extensión de cualquier intervalo que contenga al
punto inicial x0 en el que los coeficientes p(x) y g(x) sean continuos. Es decir, la solución
puede ser discontinua o no existir sólo en los puntos en los que por lo menos una de las
funciones p(x) o g(x) sea discontinua. Por lo tanto, se obtiene cierta información cualitativa
acerca de la solución con solo identificar los puntos de discontinuidad de p(x) y g(x). A
menudo estos puntos se identifican a simple vista, sin necesidad de resolver el problema.
Por lo tanto, si los coeficientes p(x) y g(x) son continuos para todo x ∈ R, entonces la
solución también existe y es continua para todo x ∈ R.
El teorema también afirma que la solución y = y(x) es una función diferenciable, ya que
su derivada y 0 (x) = −p(x)y + g(x) es continua.
Nociones de topologı́a en Rn
Varias de las propiedades más profundas del análisis real, como la convergencia y la con-
tinuidad, dependen de ciertas nociones y resultados topológicos. Introduciremos los conceptos
topológicos básicos y derivaremos algunas de las más cruciales propiedades topológicas del espacio
euclideano Rn .
Estudiaremos los conjuntos abiertos, que generalizan los intervalos abiertos de R, ası́ como
los conjuntos cerrados, que generalizan los intervalos cerrados. El estudio de conjuntos abiertos
y cerrados constituye el principio de la topologı́a. La mayorı́a del material se basa únicamente en
las propiedades de la función distancia y, por lo tanto, tiene sentido en cualquier espacio general
donde se defina una función distancia.
En particular:
1. d(x, y) ≥ 0.
Es decir, la distancia entre dos puntos es no negativa.
2. d(x, y) = 0 si y solo si x = y.
En otras palabras, el único punto que está a distancia cero de otro es el mismo punto.
10
CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN
2.2. Bolas.
Introducimos en primer lugar el concepto de bola (o entorno) de radio ε en un espacio métrico
cualquiera, aunque nosotros nos concentraremos en el estudio del caso del espacio métrico Rn .
Definición 2.2.1 Sea (M, d) un espacio métrico M con una función distancia d definida en él.
Para cada c ∈ M y δ > 0, el conjunto
B(c, δ) = Bδ (c) = {x ∈ M : d(x, c) < δ}
se denomina bola de centro c y radio δ. Otras denominaciones utilizadas son entorno,
vecindad o disco de radio δ y centro c.
Ejercicio: Probar que esta definición es equivalente a la definición de conjunto abierto dada
en el curso de “Análisis Matemático II”.
Ejemplos:
Observaciones:
Proposición 2.4.2 En un espacio métrico toda bola B(x, ε), cualquiera que sean el radio ε y el
centro x, es un conjunto abierto.
Demostración: Para probar que una bola cualquiera Bε (x) es un conjunto abierto, debemos
probar que para todo punto y de la bola Bε (x) existe un radio positivo δ tal que la bola con
centro en el punto y y ese radio δ está incluı́da en la bola original Bε (x).
Sea Bε (x) una bola de cualquier radio ε y con centro en cualquier punto x del espacio métrico
en cuestión. Sea y ∈ Bε (x) un punto cualquiera en esa bola. Como y ∈ Bε (x), por definición de
Bε (x), tenemos que d(x, y) < ε. Basta tomar un número positivo δ tal que 0 < δ < ε − d(x, y)
para obtener que Bδ (y) ⊂ Bε (x). Veamos esta inclusión, mostrando que todo punto z en Bδ (y)
es también un punto de Bε (x).
Consideremos z ∈ Bδ (y). Por la desigualdad triangular (2.1) vale que d(z, x) ≤ d(z, y) +
d(y, x). Por otro lado, como z ∈ Bδ (y), tenemos que d(z, y) < δ y, entonces, d(z, x) ≤ d(z, y) +
d(y, x) < δ+d(x, y) (recordemos también que d(x, y) = d(y, x)). Dado que elegimos δ < ε−d(x, y),
tenemos que δ +d(x, y) < ε y, por lo tanto, d(z, x) < δ +d(x, y) < ε, es decir, z ∈ Bε (x). Con esto
probamos que todo punto z ∈ Bδ (y) es tal que z ∈ Bε (x) o, equivalentemente, que todo punto en
Bδ (y) pertenece también a Bε (x). Es decir, probamos que Bδ (y) ⊂ Bε (x) y, consecuentemente,
la bola arbitraria Bε (x) es un conjunto abierto.
Ejercicios:
Ejemplos:
Ejercicios:
Observación: Existen conjuntos que no son abiertos ni cerrados. Por ejemplo, un intervalo
semiabierto (0, 1] no es abierto ni cerrado en R.
Por lo tanto, aunque sepamos que un conjunto no es abierto, no podemos concluir que sea
necesariamente cerrado.
Nota: El punto de acumulación no tiene que pertenecer al conjunto del que es punto de
acumulación.
3. Todos los puntos de [0, 1] son puntos de acumulación del intervalo abierto (0, 1).
Las definiciones de punto de acumulación y de conjunto cerrado tienen una estrecha relación,
como lo demuestra el siguiente teorema.
Demostración:
⇒) Supongamos que A es cerrado y x es un punto de acumulación de A. Si x ∈ / A, el
n
complemento R − A es un conjunto abierto que contiene a x y que debe contener al menos un
punto de A porque x es punto de acumulación de A. Esto es un absurdo, pues el complemento
de A no contiene puntos de A. Luego el punto x de acumulación de A debe pertenecer a A.
⇐) Supongamos que un conjunto A contiene todos sus puntos de acumulación y probemos
que A es cerrado, mostrando que Rn − A es abierto.
Sea y ∈ Rn − A, entonces por nuestra hipótesis de que A contiene todos sus puntos de
acumulación, y no es un punto de acumulación de A. Ası́, existe un conjunto abierto V que
contiene a y y que no contiene puntos de A. Luego V está contenido en Rn − A, por lo que el
punto y es un punto interior de Rn − A y, como y es un punto arbitrario de Rn − A, tenemos que
todo punto de Rn − A es interior. Luego, Rn − A es abierto.
El teorema 2.8.2 puede ser intuitivamente claro pues la propiedad de ser cerrado significa,
a grandes rasgos, que un conjunto contiene todos los puntos de su “frontera”, y tales puntos
son puntos de acumulación. Este tipo de argumento es impreciso y tiene ciertas dificultades, por
ejemplo en casos donde la intuición de “frontera” no es clara, por lo que debemos tener cuidado
ya que algunos conjuntos son lo bastante complejos como para que falle nuestra intuición. Por
ejemplo, el conjunto A = {1/n ∈ R : n ∈ Z} ∪ {0} es cerrado y su único punto de acumulación,
que es {0}, pertenece a A (ver como ejercicio).
Nota: Observar que este teorema da la equivalencia entre la definición de conjunto cerrado
vista en este curso y la definición considerada en “Análisis Matemático II”.
Observación: Un conjunto no tiene por qué tener puntos de acumulación pero, en ese caso,
el teorema (2.8.2) se aplica trivialmente y de ese modo podemos concluir que un conjunto sin
puntos de acumulación es cerrado.
Ejercicios: Probar que los siguientes conjuntos no poseen puntos de acumulación, por lo
tanto, son cerrados.
1. Un conjunto de un único punto.
2. El conjunto de números enteros en R.
3. Determinar los puntos de acumulación de S = {(x, y) ∈ R2 : y < x2 + 1}. (Idea: observar
la figura siguiente)
A la vista de esta proposición, en otras palabras, podemos afirmar que para determinar la
clausura de un conjunto A, añadimos a A todos los puntos de acumulación que no se encuentren
ya en A.
Ejemplos/Ejercicios:
1. Para cualquier A ⊂ Rn , mostrar que Rn − cl(A) es abierto.
2. La clausura de un conjunto es igual a la clausura de su complemento.
Proposición 2.10.2 Sea A ⊂ M. Entonces x ∈ ∂A si y solo si para todo ε > 0, B(x, ε) contiene
puntos de A y de M − A.
Ejercicios:
Convexo No convexo
Es mucho más difı́cil mostrar que un conjunto es conexo que mostrar que es disconexo. Para
mostrar que un conjunto es disconexo se necesita encontrar solo un par de conjuntos A y B en
las condiciones de la definición, mientras que para mostrar que un conjunto es conexo se necesita
mostrar que no existe ningún par de estos conjuntos.
Definición 2.13.1 Si x e y son dos puntos en Rn , entonces una curva poligonal que une x e
y es un conjunto obtenido como unión de un número finito de segmentos ordenados (L1 , L2 , ...Ln )
en Rn tal que el segmento L1 tiene puntos extremos x y z1 ; el segmento L2 tiene extremos z1 y
z2 ; ...; y el segmento Ln tiene extremos zn−1 e y.
Dem:
Supongamos que G es un conjunto conexo abierto en Rn y que x ∈ G. Sea G1 el subconjunto
de G que consiste de todos los puntos de G que pueden ser unidos a x por una curva poligonal
que yace enteramente en G; sea G2 el conjunto de todos los puntos de G que no pueden ser
unidos a x por una curva poligonal en G. Es claro que G1 ∩ G2 = ∅ y G1 ∪ G2 = G. El conjunto
G1 es no vacı́o pues contiene al punto x. Mostraremos ahora que G1 es abierto en Rn .
Si y ∈ G1 , sigue del hecho de que G es abierto que para algún número real positivo r, se
tiene que |w − y| < r implica que w ∈ G. Por definición de G1 , el punto y puede ser unido a
x por una curva poligonal y agregando un segmento de y a w (que existe porque una bola es
convexa, ver ejercicio anterior), inferimos que w ∈ G1 . Luego G1 es un subconjunto abierto de
Rn . Similarmente, el subconjunto G2 es abierto en Rn .
Si G2 = ∅, no hay nada que probar.
Si G2 es no vacı́o, entonces los conjuntos G1 , G2 desconectan G, contradiciendo la hipótesis
de que G es conexo.
Luego, G2 = ∅ y todo punto de G puede ser unido a x por una curva poligonal enteramente
contenida en G.
Observación: También vale, para todo conjunto no necesariamente abierto, la recı́proca del
teorema 2.13.2, es decir, si todo par de puntos de un conjunto puede unirse por una poligonal
totalmente contenida en el conjunto, el conjunto es conexo. No veremos la prueba por el momento.
Nota: El hecho de que todo par de puntos de un conjunto puede unirse por una poligonal
totalmente contenida en el conjunto es la definición de conjunto arco-conexo considerada en el
curso de “Análisis Matemático II”.
Equivalentemente, puede definirse la noción de conjunto arco-conexo como sigue.
Definición 2.13.3 Un arco continuo que une dos puntos x, y en un espacio métrico M es
una aplicación ϕ : [a, b] → M continua tal que ϕ(a) = x y ϕ(b) = y. Decimos que un arco ϕ
está contenido en un conjunto A si ϕ(t) ∈ A para todo t ∈ [a, b].
Definición 2.13.4 Decimos que un conjunto es arco-conexo (o conexo por arcos) si todo
par de puntos del conjunto se pueden unir mediante un arco continuo contenido en el conjunto.
¿Cómo podemos recuperar en varias variables la idea de derivabilidad de una función de una
variable real f : R → R como una propiedad de suavidad de una función, en particular, de
continuidad?
Lo que haremos será recurrir a la idea de aproximación lineal que en una variable está dada
por la recta tangente.
f (x0 + h) − f (x0 )
lı́m = f 0 (x0 ).
h→0 h
De forma equivalente, podemos escribir esta fórmula como las siguientes igualdades:
24
CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES
Observemos que la función T (s) = ms es lineal: En efecto, T (αs + βt) = m(αs + βt) =
α(ms) + β(mt) = αT (s) + βT (t) para todo α, β, s y t reales.
Es decir, que la función x − x0 7→ m(x − x0 ) es una función lineal en x − x0 que sumada a
f (x0 ) aproxima a la función f (x) “cerca” de x0 .
Para generalizar este concepto al caso de las transformaciones f : A ⊂ Rn → Rm , damos la
siguiente definición.
En esta definición, Df (x0 )(x−x0 ) denota el valor de la transformación lineal Df (x0 ) aplicada
al vector x − x0 ∈ Rn , de modo que Df (x0 )(x − x0 ) ∈ Rm . Con frecuencia escribiremos Df (x0 ).h
en vez de Df (x0 )(h).
Podemos reescribir la definición diciendo que para cada ε > 0 existe δ > 0 tal que x ∈ A y
k x − x0 k< δ implican
En la definición 3.1.1 está implı́cito que x 6= x0 , pero en esta última formulación, podemos
permitir que x = x0 , pues ambos miembros se reducen a cero.
Intuitivamente, se supone que x 7→ f (x0 ) + Df (x0 )(x − x0 ) es la mejor aproximación “afı́n”
a f cerca del punto x0 .
Nota: Afı́n significa lineal (el nulo va al nulo) más una constante o translación a otro punto no
nulo, en forma análoga a la recta tangente que es lineal en una variable pero que, eventualmente,
no pasa por cero sino por el punto de la curva donde es tangente.
Intuitivamente, esperamos que haya solo una mejor aproximación lineal de una función en
un punto. El siguiente teorema prueba que esa intuición es correcta si suponemos que A es un
conjunto abierto.
lı́m k L1 .e − L2 .e k= 0
x→x0
Ejemplos:
dx3
1. Sea f : R → R tal que f (x) = x3 . Entonces f 0 (x) = = 3x2 . Luego, Df (x) es la
dx
transformación lineal h 7→ Df (x).h = 3x2 h.
Ejercicios:
1. Probar que si f : Rn → Rm es constante, entonces Df (x0 ) = 0 para cada x0 ∈ Rn .
Además de la definición del diferencial Df (x) mediante un lı́mite, hay otra forma de derivar
“parcialmente” una función f de varias variables.
Dada f : Rn → Rm , escribimos la imagen de f en componentes
Entonces tiene sentido considerar la derivada usual (en una variable) de cada componente fj
con respecto a la variable xi mientras mantenemos las demás variables x1 , ..., xi−1 , xi+1 , ..., xn
fijas (como si xi fuera la única variable de la función fj ). Esta derivada se llama “parcial” pues
se deriva solamente respecto de la variable xi que no es la única variable de la función fj . Su
definición formal es la que sigue.
Demostración:
Por definición de la matriz de una transformación lineal en las bases canónicas, el elemento
(j, i) de la matriz de Df (x) es la j-ésima componente del vector Df (x).ei , es decir, de la trans-
formación Df (x) aplicada al i-ésimo vector ei de la base canónica. Notamos esta componente
aji .
Sea y = x + hei , para h ∈ R, y observemos que
k f (y) − f (x) − Df (x).(y − x) k k f (x1 , ..., xi + h, ..., xn ) − f (x1 , ..., xn ) − hDf (x).ei k
=
ky−xk khk
tiende a cero cuando h → 0, por ser Df (x) el diferencial de f . Si todo el cociente (que es un
módulo en el espacio euclideano Rn ) tiende a cero, podemos afirmar que cada componente tiende
a cero, en particular, también lo hace la j-ésima componente del cociente. Es decir,
Por lo tanto,
fj (x1 , ..., xi + h, ..., xn ) − fj (x1 , ..., xn ) h.aji
lı́m = lı́m = aji .
h→0 h h→0 h
Ası́, hemos probado que
Definición 3.3.2 La matriz (3.2) del teorema 3.3.1 se llama la matriz jacobiana o matriz
derivada de f .
(x sen(y))
Ejemplo: Sea f (x, y, z) = . Calcular grad(f ).
z
!
∂f ∂f ∂f
grad(f ) = , , .
∂x ∂y ∂z
∂f sen(y) ∂f x cos(y) ∂f x sen(y)
En este caso, tenemos = , = , =− .
∂x z ∂y z! ∂z z2
sen(y) x cos(y) x sen(y)
Luego, ∇f (x, y, z) = , ,− .
z z z2
Ejercicio: Sea f : R2 → R3 dada por f (x, y) = (x2 , x3 y, x4 y 2 ). Calcular Df.
Como la matriz jacobiana proporciona una herramienta de cálculo eficaz del diferencial de
una función en el caso en que la función sea diferenciable (ver teorema 3.3.1), serı́a útil saber si
la existencia de las derivadas parciales implica que la diferencial Df existe. Esto, por desgracia,
no es cierto en general. Por ejemplo, sea f : R2 → R dada por
x, si y = 0
f (x, y) = y, si x = 0
1, en otro caso
Entonces ∂f /∂x y ∂f /∂y existen en (0, 0) y son iguales a 1. Sin embargo, f no es continua
en (0, 0) (¿por qué? Ejercicio).
Dado que la idea es generalizar el caso de una variable y conservar la propiedad de continuidad
para una función diferenciable, si una función de varias variables no es continua en un punto, no
deberı́a ser diferenciable en ese punto.
Es bastante sencillo comprender por qué no es suficiente que las derivadas parciales existan
para que se tenga la diferenciabilidad de una función de varias variables. Las derivadas parciales
solo dependen de lo que ocurre en la dirección de los ejes X e Y , mientras que la definición de
la diferencial Df implica el comportamiento combinado de f en todo un entorno de un punto
dado, en todas las direcciones posibles en ese entorno. Si embargo, podemos afirmar lo siguiente.
f (y) − f (x) = f (y1 , y2 , ..., yn ) − f (x1 , y2 , ..., yn ) + f (x1 , y2 , ..., yn ) − f (x1 , x2 , y3 , ..., yn )
! !
∂f ∂f
f (y) − f (x) = (u1 , y2 , ..., yn ) (y1 − x1 ) + (x1 , u2 , y3 , ..., yn ) (y2 − x2 ) + . . . +
∂x1 ∂x2
!
∂f
(x1 , x2 , ..., xn−1 , un ) (yn − xn ).
∂xn
Como f : Rn → R, por la hipótesis de que podemos pensar en solo una componente, tenemos
la fórmula (3.3) que nos permite escribir
n
X ∂f
Df (x)(y − x) = (x1 , ..., xn )(yi − xi ), entonces
i=1 ∂x1
!
∂f ∂f
|f (y) − f (x) − Df (x)(y − x)| = (u1 , y2 , ..., yn ) − (x1 , ..., xn ) (y1 − x1 )
∂x1 ∂x1
!
∂f ∂f
+ (x1 , u2 , y3 , ..., yn ) − (x1 , ..., xn ) (y2 − x2 ) + . . .
∂x2 ∂x2
!
∂f ∂f
+ (x1 , x2 , ..., xn−1 , un ) − (x1 , ..., xn ) (yn − xn )
∂xn ∂xn
(
∂f ∂f
≤
(u , y , ..., yn ) − (x1 , ..., xn ) + . . . +
∂x1 1 2
∂x1
)
∂f ∂f
(x , ..., xn−1 , un ) − (x1 , ..., xn ) .ky−xk
∂xn 1
∂xn
3.4.1. Continuidad
Ası́, volviendo a nuestra desigualdad (3.4), basta tomar M = M0 +1 para obtener el resultado
de la proposición.
Dijimos al comienzo del estudio del tema diferenciabilidad de una función que tenı́amos
intención de recuperar la idea de que una función diferenciable es una función suave, en particular
continua. Con la última proposición de la clase anterior lo hemos conseguido, hemos visto que la
diferenciabilidad de una función es garantı́a de su continuidad.
También adelantamos que para la idea geométrica de una función diferenciable recurrirı́amos
a la idea de aproximación lineal (o afı́n). En este sentido, supongamos que tenemos una función
f : Rn → R para la que existen todas sus derivadas parciales y nos preguntamos si estas
derivadas forman un “hiperplano” en Rn+1 , y si este “plano” aproxima a la función. En lo que
sigue estudiaremos estas ideas.
Para una función f : R2 → R, las derivadas direccionales Df (x0 ).e se pueden usar para
determinar el plano tangente a la gráfica de f . Es decir, la recta L(x) dada por z = f (x0 ) +
Df (x0 ).te es tangente a la gráfica de f pues Df (x0 ).e es la variación de f en la dirección de e.
Ası́, el plano tangente a la gráfica de f en (x0 , f (x0 )) se puede definir mediante la ecuación
tiene como gráfico {(x1 , . . . , xn+1 ) : xn+1 = ϕ(x1 , . . . , xn )} y se define como la variedad lineal
tangente a la “superficie” xn+1 = f (x1 , . . . , xn ) en el punto {(x0 , f (x0 ))} de la misma.
Observemos que el miembro derecho de la última igualdad está bien definido, pues
Df (x0 ) : Rn → Rm y Dg(f (x0 )) : Rm → Rp y, por lo tanto, su composición como transfor-
maciones lineales está definida. La regla de la cadena nos dice cómo derivar una composición de
funciones.
Demostración: Para demostrar D(g ◦ f )(x0 ).y = Dg(f (x0 )).(Df (x0 ).y), mostraremos que
k (g◦f )(x)−(g◦f )(x0 )−Dg(f (x0 )).Df (x0 )(x−x0 ) k=k g(f (x))−g(f (x0 ))−Dg(f (x0 ))(f (x)−f (x0 ))+
Como Dg(f (x0 )) es una transformación lineal, sabemos que existe 0 6= N ∈ R tal que
k Dg(f (x0 ))(y) k≤ N.kyk para todo y ∈ Rm (ver demostración de la propiedad local de Lipschitz
ε
en Clase 5). Ahora bien, por la definición de la diferencial de f , dado > 0 existe δ3 > 0 tal
2N
que k x − x0 k< δ3 implica
k Dg(f (x0 ))(f (x) − f (x0 ) − Df (x0 )(x − x0 )) k k f (x) − f (x0 ) − Df (x0 )(x − x0 )) k ε
≤N < .
k x − x0 k k x − x0 k 2
k g(f (x)) − g(f (x0 )) − Dg(f (x0 )).(f (x) − f (x0 )) k k Dg(f (x0 ))(f (x) − f (x0 ) − Df (x0 )(x − x0 ) k
+ <
k x − x0 k k x − x0 k
ε ε
< + = ε,
2 2
lo que demuestra la fórmula.
Esta situación aparece al realizar un “cambio de variable”. Por ejemplo, supongamos que
f (x, y) es una función escalar y x = r cos θ, y = r sen θ definen las nuevas variables r, θ en
coordenadas polares. Definimos la función h(r, θ) = f (r cos θ, r sen θ). Entonces
∂h ∂f ∂x ∂f ∂y ∂f ∂f ∂h ∂f ∂x ∂f ∂y ∂f ∂f
= + = cos θ + sen θ y = + = − r sen θ + r cos θ.
∂r ∂x ∂r ∂y ∂r ∂x ∂y ∂θ ∂x ∂θ ∂y ∂θ ∂x ∂y
ε
2. k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k≤ k x − x0 k (pues f es diferenciable en x0 ).
3M
Y si f (x0 ) 6= 0 y Df (x0 ) 6= 0 (si no no son necesarias las siguientes condiciones):
ε
3. |g(x) − g(x0 ) − Dg(x0 )(x − x0 )| ≤ k x − x0 k (pues g es diferenciable en x0 ).
3 k f (x0 ) k
ε
4. |g(x) − g(x0 )| ≤ , (pues g es continua en x0 ).
3M
Esta elección de δ tal que se verifiquen las cuatro condiciones anteriores es posible tomando,
como en demostraciones anteriores, el mı́nimo de todos los δ que existen en cada caso por las
razones indicadas.
Entonces si k x − x0 k< δ, por la desigualdad triangular obtenemos
k g(x)f (x) − g(x0 )f (x0 ) − g(x0 )Df (x0 )(x − x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k=
k g(x)f (x)−g(x)f (x0 )−g(x)Df (x0 )(x − x0 ) + g(x)Df (x0 )(x − x0 ) − g(x0 )Df (x0 )(x − x0 )+
+g(x)f (x0 ) − g(x0 )f (x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k≤
k g(x)f (x)−g(x)f (x0 )−g(x)Df (x0 )(x−x0 ) k + k g(x)Df (x0 )(x−x0 )−g(x0 )Df (x0 )(x−x0 ) k +
k g(x)f (x0 ) − g(x0 )f (x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k=
= |g(x)| k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k +|g(x) − g(x0 )| k Df (x0 )(x − x0 ) k +
k g(x) − g(x0 ) − Dg(x0 )(x − x0 ) k kf (x0 )k
ε k x − x0 k ε ε k x − x0 k
≤ M. + M0 k x − x0 k + . k f (x0 ) k= ε0 k x − x0 k
3M 3M 3 k f (x0 ) k
A veces abreviamos este resultado diciendo que D(gf ) = gDf + (Dg)f, pero el significado
preciso es el del enunciado de la proposición.
Para los cocientes, tenemos el siguiente resultado análogo al caso de una variable. Si g 6= 0,
entonces !
f g Df − (Dg)f
D = .
g g2
Esta definición tiene sentido, pues D2 f (x0 ) : Rn → L(Rn , Rm ) y entonces D2 f (x0 )(x1 ) ∈
L(Rn , Rm ); por lo tanto, se puede aplicar a x2 y se obtiene un punto de Rm .
La razón por la que definimos la diferencial segunda como una transformación lineal de esa
forma es que considerando Bx0 se evita el uso innecesario del espacio conceptualmente difı́cil
L(Rn , L(Rn , Rm )).
39
CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR
Ejercicio: Probar que la aplicación Bx0 que hemos definido es una aplicación bilineal de
Rn × Rn → Rm .
Dada una aplicación bilineal B : E × F → R, podemos asociarle una matriz con cada elección
de bases e1 , ..., en de E y f1 , ..., fm de F ; es decir, podemos hacer
aij = B(ei , fj ).
Si n m
X X
x= xi ei e y= y j fj ,
i=1 j=1
entonces
a
11
. . . a1m y1
aij xi yj = x1 . . . . .. .. .
X
B(x, y) = xn .. . .. .
.
ij
an1 . . . anm ym
Observemos que la matriz asociada a B depende de la elección de las bases de E y F .
Nota: Para la diferencial segunda, haremos un abuso de notación y seguiremos escribiendo
2
D f (x0 ) para la aplicación bilineal Bx0 obtenida al diferenciar Df (x0 ) como se describió en los
párrafos anteriores.
Ahora veremos una definición que necesitaremos para lo que sigue, la noción de función de
clase C r .
Definición 4.1.3 Una función es de clase C r si las primeras r derivadas existen y son con-
tinuas (de forma equivalente, esto significa que todas las derivadas parciales hasta de orden r
existen y son continuas). Una función es suave o de clase C ∞ si es de clase C r para todos los
enteros positivos r.
Observación: El uso iterado de la regla de la cadena se puede usar para demostrar que la
composición de funciones C r también es C r .
∂ 2f ∂ 2f
...
∂x1 ∂x1 ∂x1 ∂xn
.. ... ..
. .
2
∂ f ∂ 2f
...
∂xn ∂x1 ∂xn ∂xn
donde cada derivada parcial está evaluada en el punto x = (x1 , ..., xn ).
Demostración:
! La representación matricial de Df : A → L(Rn , R) es el vector fila
∂f ∂f
,..., , de modo que por la definición de la matriz jacobiana, en una versión adecuada
∂x1 ∂xn
2
para los vectores fila, D2 f : A → Rn está dada por
∂ 2f ∂ 2f ∂ 2f
...
∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn
.. .. .. ..
. . . .
∂ 2f 2
∂ f 2
∂ f
...
∂xn ∂x1 ∂xn ∂x2 ∂xn ∂xn
Si consideramos D2 f como una aplicación bilineal, la representación matricial no cambia,
como muestra un análisis de la definición.
Para las derivadas de orden superior, procedemos de forma análoga. Por ejemplo, D3 f da una
aplicación trilineal D3 f : Rn × Rn × Rn → Rm para cada x. No asociamos una matriz con esta
∂ 3 fk
aplicación, sino las derivadas de orden tres etiquetadas con cuatro ı́ndices: para cada
∂xl xj xi
componente fk .
Ahora veremos una propiedad importante de la segunda derivada que afirma que la matriz
del teorema anterior es, en condiciones muy débiles, simétrica.
Teorema 4.1.5 Simetrı́a de las derivadas cruzadas Sea f : A → Rm dos veces diferencia-
∂ 2 fk
ble en el conjunto abierto A ⊂ Rn con D2 f continua (es decir, con todas las funciones
∂xi ∂xj
continuas). Entonces D2 f es simétrica; es decir, D2 f (x)(x1 , x2 ) = D2 f (x)(x2 , x1 ) o, en términos
de componentes,
∂ 2 fk ∂ 2 fk
= .
∂xi ∂xj ∂xj ∂xi
Demostración: Mostrar que D2 f (x).(x, y) = D2 f (x).(y, x) es equivalente a establecer que
para todo i, j, k
∂ 2 fk ∂ 2 fk
= .
∂xi ∂xj ∂xj ∂xi
Manteniendo las demás variables fijas, podemos suponer que f es de clase C 2 en f : A ⊂
R2 → R (pues lo probamos para cada componente que es una función escalar y para todo par
de variables correspondiente a la derivada parcial de segundo orden). Para (x, y) ∈ A y h, k
pequeños, consideramos la cantidad
Sh,k = [f (x + h, y + k) − f (x + h, y)] − [f (x, y + k) − f (x, y)].
Definimos la función gk como gk (u) = f (u, y + k) − f (u, y), y observamos que la fórmula para
Sh,k se puede escribir como Sh,k = gk (x + h) − gk (x). Ası́, por el teorema del valor medio en una
variable, Sh,k = gk0 (ch,k ).h para algún ch,k entre x y x + h. Por lo tanto,
( ) ( ! )
∂f ∂f ∂ ∂f ∂ 2f
Sh,k = (ch,k , y + k) − (ch,k , y) h = (ch,k , dh,k ) k h = (ch,k , dh,k ).hk
∂x ∂x ∂y ∂x ∂y∂x
para algún dh,k entre y e y + k.
Pero Sh,k es “simétrica” con respecto a h, k y de x, y, ya que al intercambiar los dos términos
intermedios en Sh,k , podemos obtener (de la misma forma)
∂ 2f
Sh,k = (c̃h,k , d˜h,k ).hk.
∂x∂y
La simetrı́a de las segundas derivadas representa una propiedad fundamental que no aparece
en el cálculo de una variable y el teorema 4.1.5 no es intuitivamente obvio. Sin embargo, se puede
obtener cierta intuición a partir de la idea principal de la demostración. El hecho algebraico de
que S se puede escribir como la diferencia de las diferencias de dos formas (horizontal y después
vertical, o viceversa) es la razón de la igualdad de las derivadas parciales cruzadas.
donde Dk f (x)(y − x, ..., y − x) denota Dk f (x) como una aplicación k-lineal aplicada a la k-upla
(y − x, ..., y − x). En coordenadas,
n
∂kf
!
k
X
D f (x)(y − x, ..., y − x) = (yi1 − xi1 ) . . . (yik − xik ).
i1 ,...,ik =1 ∂xi1 ...∂xik
Si integramos la expresión del miembro derecho por partes y usamos la fórmula general
Z 1
dv Z 1
du
u dt = − v dt + uv|10
0 dt 0 dt
!
∂f
con u= (x + th)hi y v = t − 1. Entonces,
∂xi
n Z 1 n Z 1 n
X ∂f X ∂ 2f X ∂f
(x + th)hi dt = (1 − t) (x + th)hi hk dt + hi (x),
i=1 0 ∂xi i,k=1 0 ∂xi ∂xk i=1 ∂xi
pues
du ∂ 2f
= (x + th)hi hk ,
dt ∂xi ∂xk
por la regla de la cadena, y
∂f ∂f
uv |10 = (t − 1) (x + th)hi |1t=0 = (x)hi .
∂xi ∂xi
Por lo tanto, hemos demostrado la identidad
n
X ∂f
f (x + h) − f (x) = (x).hi + R1 (x, h)
i=1 ∂xi
donde n Z 1
X ∂ 2f
R1 (x, h) = (1 − t) (x + th)hi hk dt.
i,k=1 0 ∂xi ∂xk
Como |hi | ≤ khk, obtenemos
n Z 1
X ∂ 2f
2
|R1 (x0 , h)| ≤ khk (1 − t) (x + th) dt .
∂xi ∂xk 0
i,k=1 0
El integrando de la última fórmula es una función continua y, por lo tanto, está acotada en
R1 (x0 , h)
una pequeña vecindad de x0 . Ası́, obtenemos −→ 0.
khk h→0
∂ 2f (t − 1)2
Si integramos R1 (x, h) por partes nuevamente, con u = (x+th)hi hk y v=− ,
∂xi ∂xk 2
obtenemos
XZ 1 (t − 1)2 ∂ 3f X 1 ∂ 2f
R1 (x, h) = (x + th)hi hj hk dt + (x)hi hj .
i,j,k 0 2 ∂xi ∂xj ∂xk i,j 2 ∂xi ∂xj
donde
XZ 1 (t − 1)2 ∂ 3f
R2 (x, h) = (x + th)hi hj hk dt.
i,j,k 0 2 ∂xi ∂xj ∂xk
Nuevamente, como el integrando de la última fórmula es una función continua y, por lo tanto,
R2 (x0 , h)
acotada se tiene que |R2 (x, h)| ≤ khk3 M y entonces ≤ M khk −→ 0.
khk2 h→0
La fórmula para el resto establecida en la fórmula (4.1) del teorema, conocida como la fórmula
de Lagrange para el resto, se obtiene al aplicar el segundo teorema del valor medio para integrales.
Recordemos que éste teorema establece que
Z b Z b
f (x)g(x)dx = f (c) g(x)dx,
a a
1 3
D f (c).(h, h, h)
=
3!
con c en la recta que une x con y = x + h.
Procediendo por inducción, usando el mismo método, puede obtenerse el resultado general.
Definición 4.2.2 La serie de Taylor de una función f en las condiciones del teorema de
Taylor 4.2.1 alrededor de un punto x0 , es la serie dada por
∞
X 1 k
D f (x0 )(x − x0 , ..., x − x0 ).
k=0 k!
Nota: Esta serie no tiene por qué converger a f (x), incluso si f es C ∞ . Si converge a f en
alguna vecindad de x0 , decimos que f es analı́tica en sentido real en x0 . Ası́, una función es
analı́tica en sentido real si el término del resto tiende a cero cuando r tiende a infinito, es decir,
1 r
lı́m
r→∞ r!
D f (c)(x − x0 , ..., x − x0 ) = 0.
Definición 5.0.1 Si V y W son espacios vectoriales normados (es decir, con una función dis-
tancia definida en ellos y sus correspondientes normas) sobre los mismos escalares entonces, si
T : V → W es una transformación lineal continua, se define la norma de la transformación
lineal T como ( )
kT (v)k
kT k := sup : 0 6= v ∈ V .
kvk
k f (x1 ) − f (x2 ) k≤ M k x1 − x2 k .
45
CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA
El teorema del valor medio se usa, como en el caso de una variable, para acotar el incremento
de la función en el caso en que se conozca una cota de la norma de la diferencial de la función,
aunque el cálculo exacto de la norma de una transformación lineal no suele resultar simple.
tiene una única solución x1 , ..., xn si la matriz A = (aij ) no es singular; es decir, si det(A) 6= 0,
donde det(A) denota el determinante de A.
¿Qué ocurre con las ecuaciones no lineales?
f (x , ..., xn ) = y1
1 1
Para un sistema de la forma .. , ¿cuándo podemos despejar x1 , ..., xn ?
.
f (x , ..., x ) = y
n 1 n n
Jf (x) =
.
. ... .. ≡ ∂(f1 , ..., fn ) ,
. . ∂(x , ..., x )
1 n
∂fn ∂fn
∂x ...
1 ∂xn
donde las derivadas parciales se evalúan en x = (x1 , ..., xn ).
Si Jf (x) 6= 0 cabe esperar que se pueda despejar x en f (x) = y.
Entonces existe r > 0 tal que B(r, x0 ) ⊂ A, f |B(r,x0 ) : B(r, x0 ) → f (B(r, x0 )) es biyectiva, donde
f (B(r, x0 )) es abierto, f −1 : f (B(r, x0 )) → B(r, x0 ) es diferenciable y vale que
Decir que f tiene una inversa f −1 significa exactamente que en algún dominio de f podemos
resolver de forma única para x la ecuación f (x) = y dado cualquier y. El hecho de que exista
una solución se debe a que f es biyectiva en ese dominio.
Además, si f es biyectiva en un dominio abierto, existe una bola donde la diferencial de
la función inversa es la inversa como transformación lineal de la diferencial de la función. En
términos de matrices, la matriz de la diferencial de la función inversa es la inversa de la matriz
de la diferencial de la función.
Demostración: Probaremos en primer lugar que vale el teorema para un caso simple y luego
veremos que el caso general se reduce a este caso más simple mediante un cambio de variable en
la función dada y = f (x).
Usando (5.1) resulta para x0 = 0 y recordando que f (0) = 0 por la hipótesis del caso
1,
1 1 b
k x1 −f (x1 ) k=k x1 −f (x1 )−(0−f (0)) k=k ϕ0 (x1 )−ϕ0 (0) k≤ kx1 −0k ≤ kx1 k ≤ .
2 2 2
b b
Como y ∈ B( 2b , 0), kyk ≤ b
2
y luego, por 5.4, kx2 k ≤ + = b, es decir, que
2 2
x2 ∈ B(b, 0).
Con un razonamiento similar, se prueba que x3 = ϕy (x2 ) ∈ B(b, 0) y, en general, si se
define recursivamente xk = ϕy (xk−1 ) resulta xk ∈ B(b, 0).
1
En general, asumiendo kxk − xk−1 k ≤ kx2 − x1 k resulta
2k−2
1 1
kxk+1 − xk k =k ϕy (xk ) − ϕy (xk−1 ) k≤ kxk − xk−1 k ≤ k−1 kx2 − x1 k.
2 2
1
Luego, por inducción, la fórmula k xk − xk−1 k≤ k−2 k x2 − x1 k es válida para todo
2
1 < k ∈ N.
1 1 1 1 1 − (1/2)e−k 1 1 1
+ + ... + = . < k−1 . = k−2 .
2e−2 2e−3 2k−1 2 k−1 1 − 1/2 2 1/2 2
kx2 − x1 k
Finalmente, resulta ası́ que kxe − xk k ≤ .
2k−2
kx2 − x1 k
Como kx2 − x1 k es fijo (no depende de k), resulta → 0 para k → ∞.
2k−2
Luego, por el criterio de Cauchy, la sucesión xk es convergente, es decir, existe x tal que
xk → x para k → ∞. Como los xk ∈ B(b, 0) y B(b, 0) es cerrado, resulta x ∈ B(b, 0).
Finalmente teniendo en cuenta que ϕy es continua y pasando al lı́mite, resulta:
ϕy cont
z}|{
x = lı́m xk = lı́m ϕy (xk−1 ) = ϕy lı́m xk−1 = ϕy (x).
k→∞ k→∞ k→∞
por lo que dado ε > 0 tenemos que kf (x) − xk ≤ ε̃kxk, si x es suficientemente cercano
a cero. Entonces podemos escribir
kf (x) − xk ≤ ε kf (x)k
2. Caso general.
Sea y0 = f (x0 ). Se hace el siguiente cambio de las variables x, y por las variables u, v siendo
v = y − y0 y u = Df (x0 )(x − x0 ). Luego, como Df (x0 ) 6= 0, x = [Df (x0 )]−1 u + x0 .
Reemplazando las variables x, y por las nuevas variables u, v en y = f (x), se obtiene
y = v + y0 = f ([Df (x0 )]−1 u + x0 ) = f (x) y, luego,
Es decir, la función v = F (u), cumple las hipótesis del caso simplicado por lo que
puede hallarse b > 0 tal que k I − DF (u) k≤ 21 para u ∈ B(b, 0) y, por lo tanto, existe
F −1 : B(b/2, 0) → Rn .
Entonces, existe δ > 0 tal que f −1 : B(δ, y0 ) → Rn (ver esto en detalle como ejercicio).
Por lo tanto, para x0 ∈ A, existe δ = δ(x0 ) tal que B(δ, y0 ) ⊆ f (A) y ası́, en particular,
resulta que f (A) es abierto.
La diferenciabilidad de F −1 en u = 0 es equivalente a la diferenciabilidad de f −1 en
y = y0 pues, como por (5.5) tenemos que DF (0) = Df (x0 )[Df (x0 )]−1 , entonces vale
que
Df −1 (y0 ) = [Df (x0 )]−1 DF −1 (0).
Luego, como DF −1 (0) = [DF (0)]−1 = I, obtenemos que Df −1 (y0 ) = [Df (x0 )]−1 .
Finalmente, para ver que f −1 : B(δ, y0 ) → Rn es continua basta observar que, según
se probó, para y = f (x) ∈ B(δ, y0 ) vale
y como Df (x) y f −1 (y) son continuas, resulta Df −1 (y) continua por ser composición
de funciones continuas. Para terminar la demostración basta tomar r > 0 tal que
B(r, x0 ) ⊆ f −1 (B(δ, y0 )).
donde F = (F1 , ..., Fm ), y supongamos también que ∆(x0 , y0 ) 6= 0. Entonces existen un entorno
abierto U ⊂ Rn de x0 , un entorno V de y0 en Rm y una única función f : U → V tal que
F (x, f (x)) = 0
jacobiana de G es
1 0 ... 0 0 ... 0
0 1 ... 0 0 ... 0
.. .. .. .. .. .. ..
. . . . . . .
0 0 ...1 0 ... 0
∂F1 ∂F1 ∂F1 ∂F1
... ... ...
∂x1 ∂xn ∂y1 ∂ym
. .. .. .. ..
. .. ..
. . . . . . .
∂Fm ∂Fm ∂Fm ∂Fm
... ... ...
∂x1 ∂xn ∂y1 ∂ym
Sucesiones y continuidad
6.1. Sucesiones
La definición de convergencia de una sucesión en Rn es similar a la de convergencia de una
sucesión de números reales. De hecho, la definición tiene perfecto sentido en un espacio métrico.
Definición 6.1.1 Sea (M, d) un espacio métrico y xk una sucesión de puntos en M . Decimos
que xk converge a un punto x ∈ M y escribimos
lı́m xk = x, o xk → x cuando k → ∞,
k→∞
Esta definición coincide con la definición usual, como lo muestra la siguiente proposición.
Proposición 6.1.2 Una sucesión xk en M converge a x ∈ M si y solo si para todo ε > 0 existe
N tal que k ≥ N implica d(x, xk ) < ε.
53
CAPÍTULO 6. SUCESIONES Y CONTINUIDAD
Demostración: Ejercicio.
Proposición 6.1.8 Sea (M, d) un espacio métrico completo y N ⊂ M un subconjunto cerrado.
Entonces N también es completo.
Definición 6.2.1 Sea f : A ⊂ M → N es una función entre dos espacios métricos M y N con
métricas d y ρ, respectivamente. La función f se dice continua en un punto x0 ∈ A si para todo
ε > 0 existe δ > 0 tal que para todo x ∈ A que verifique d(x, x0 ) < δ vale que ρ(f (x), f (x0 )) < ε.
1. f es continua en A.
Demostración: 1. ⇒ 2.) Supongamos que xk → x0 . Para mostrar que f (xk ) → f (x0 ), sea
ε > 0. Entonces elegimos δ > 0 de modo que d(x, x0 ) < δ implique que ρ(f (xk ) − f (x0 )) < ε.
La existencia de tal δ está garantizada por la continuidad de f . Entonces, elegimos N tal que
k ≥ N implique d(xk , x0 )) < δ y esta elección de N prueba el resultado.
2. ⇒ 4.) Sea F ⊂ N un conjunto cerrado. Para mostrar que f −1 (F ) es cerrado en su inter-
sección con A, observemos que esto sucede si y solo si para cada sucesión xk ∈ B que converja a
un punto x ∈ A, necesariamente ocurre que x ∈ B.
Sea xk ∈ f −1 (F ) tal que xk → x, donde x ∈ A. Debemos mostrar que x ∈ f −1 (F ).
Por el inciso 2., f (xk ) → f (x), y como f (xk ) ∈ F que es cerrado (es decir, contiene a sus
puntos de acumulación), concluimos que f (x) ∈ F. Ası́, x ∈ f −1 (F ).
Teorema 6.2.3 Supongamos f : M → N una función continua entre dos espacios métricos M
y N con métricas d y ρ, respectivamente, y B ⊂ M un conjunto compacto. Entonces f (B) es
compacto.
Demostración: Sea {yk }∞ n=1 una sucesión en f (B). Por el teorema (6.1.10), debemos mostrar
que yk tiene una subsucesión convergente a un punto en f (B). Sea yk = f (xk ) para xk ∈ B. Como
B es compacto, existe una subsucesión convergente, digamos xkn → x, con x ∈ B. Entonces, por
el teorema (6.2.2), vale que f (xkn ) → f (x) y luego f (xkn ) es una subsucesión convergente de yk
con lı́mite en f (B).
Demostración: En primer lugar, S está acotado superiormente (en R), ya que S = f (K) es
compacto por el Teorema 1.3.3 de la clase pasada y, por lo tanto, es cerrado y acotado.
En segundo lugar, queremos obtener x1 tal que x1 ∈ K y f (x1 ) = sup(S). Ahora bien, si
s = sup(S), para todo ε > 0, B(s, ε) contiene un punto de S, si no fuese ası́, s − ε serı́a una cota
superior para S menor que sup(S). Luego, s ∈ cl(S). Como S es cerrado, sabemos que S = cl(S)
y entonces s = sup(S) ∈ S = f (K). Entonces, sup(S) = f (x1 ) para algún x1 ∈ K. Análogamente
se prueba el caso de inf (S).
Observación: Los valores x0 y x1 no necesariamente son únicos.
Definición 7.1.2 Decimos que sup(f (K)), cuya existencia probamos en el teorema anterior, es
el máximo (absoluto) de f en K, y al inf (f (K)) lo llamamos mı́nimo (absoluto) de f en
K.
57
CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES
En lo que sigue se trata de generalizar estos resultados, o al menos parte de ellos, para
funciones de varias variables. Comenzamos con algunas definiciones.
Ası́, la hessiana como matriz es simplemente la matriz de las segundas derivadas parciales.
Podemos hacer la siguiente generalización del criterio de la derivada segunda en una variable
para el caso de varias variables.
Demostración:
1. Si Hx0 (f ) es definida negativa, entonces Hx0 (f )(x, x) < 0 para todo x 6= 0 en Rn . Por
la definición de la hessiana, esto implica que D2 f (x0 )(x, x) < 0 para todo x 6= 0 en Rn .
Como Df (x0 )(x) es una función continua de x, vale que D2 f (x0 )(x, x) es continua (por ser
composición de funciones continuas). Además, S = {x ∈ Rn : kxk = 1} es compacto, por
lo que existe un punto x̃ ∈ S tal que 0 > D2 f (x0 )(x̃, x̃) ≥ D2 f (x0 )(x, x) para!todo x ∈ S.
x x
Sea ε = −D2 f (x0 )(x̃, x̃). Entonces D2 f (x0 )(x, x) = kxk2 D2 f (x0 ) , ≤ −εkxk2
kxk kxk
para todo x 6= 0 en Rn . Como D2 f es continua, existe δ > 0 tal que ky − x0 k < δ implica
ε
k D2 f (y) − D2 f (x0 ) k< , y podemos también elegir δ de modo que B(x0 , δ) ⊂ A.
2
1
Si y ∈ B(x0 , δ), el teorema de Taylor nos da f (y) − f (x0 ) = Df (x0 )(y − x0 ) + D2 f (c)(y −
2
x0 , y − x0 ), donde c ∈ B(x0 , δ). Ası́,
ε
k D2 f (c) − D2 f (x0 ) k<
2
implica
D2 f (c)(y − x0 , y − x0 ) ≤ D2 f (x0 )(y − x0 , y − x0 )+
k D2 f (c)(y − x0 , y − x0 ) − D2 f (x0 )(y − x0 , y − x0 ) k
ε ε
≤ −ε k y − x0 k2 + k y − x0 k2 = − k y − x0 k2 .
2 2
Como Df (x0 ) = 0, el teorema de Taylor implica
1 1 ε
f (y) − f (x0 ) = D2 f (c)(y − x0 , y − x0 ) ≤ − k y − x0 k2 < 0.
2 2 2
Por lo tanto, f (y) < f (x0 ) para todo y ∈ B(x0 , δ), y 6= x0 por lo que f tiene un máximo
local en x0 .
El polinomio de Taylor de segundo orden define la función cuadrática que mejor aproxima a la
gráfica de la función. El criterio de la diferencial segunda dice entonces que podemos determinar
el comportamiento en un punto crı́tico analizando el término de segundo orden del polinomio de
Taylor de la función.
Como hemos observado, la matriz de Hx0 (f ) = D2 f (x0 ) en la base canónica es
∂ 2f ∂ 2f ∂ 2f
...
∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn
.. .. .. ..
. . . .
∂ 2f ∂ 2f ∂ 2f
v ...
∂xn ∂x1 ∂xn ∂x2 ∂xn ∂xn
donde las derivadas parciales se evalúan en x0 .
Si n = 1, el teorema 7.2.6 se reduce al criterio f 00 (x0 ) < 0 para una variable; si f 00 (x0 ) = 0, se
puede tener un máximo, un mı́nimo o un punto silla (en este caso, el criterio falla).
Algunos resultados del álgebra lineal serán de utilidad al usar el teorema 7.2.6.
Sea ∆k el determinante de la matriz Hx0 (f ) = D2 f (x0 ) en la base canónica es
∂ 2f ∂ 2f ∂ 2f
...
∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xk
.. .. ... ..
,
. . .
∂ 2f 2
∂ f 2
∂ f
...
∂xk ∂x1 ∂xk ∂x2 ∂xk ∂xk
es decir, el determinante de la matriz hessiana de f con las últimas n − k filas y columnas
eliminadas. Este determinante proporciona un criterio para afirmar cuándo la matriz simétrica
asociada a la bilineal Hx0 (f ) = D2 f (x0 ) es definida positiva, lo que es equivalente a que la bilineal
Hx0 (f ) = D2 f (x0 ) sea definida positiva. De hecho, vale que la matriz simétrica Hx0 (f ) = D2 f (x0 )
es definida positiva si y solo si ∆k > 0 para k = 1, ..., n.
No demostraremos esto en general pero lo probaremos para las matrices de orden dos en un
ejercicio.
Ası́, por el teorema 7.2.6, tenemos el siguiente criterio para determinar si en un punto crı́tico
una función tiene un mı́nimmo local.
Al cambiar el signo de Hx0 y usar las propiedades dde los determinantes, tenemos que
Hx0 (f ) = D2 f (x0 ) es definida negativa si y solo si ∆k < 0 par k impar y ∆k > 0 para k
par, por lo que tenemos
(
∆k < 0, para k impar
f tiene un máximo en x0 si
∆k > 0, para k par
Si ∆k > 0 para algún k impar o ∆k < 0 para algún k par, entonces f no puede tener un
valor mı́nimo en x0 . De hecho, si ∆k < 0 para algún k par, f no puede tener ni un máximo
ni un mı́nimo en x0 , y x0 debe ser un punto silla de f .
Demostración: Consideremos una curva r(t) en S con vector tangente en t0 dado por r0 (t0 ),
donde r(t0 ) = x0 . Veamos que h∇f (x0 ), r0 (t0 )i = 0.
Como r(t) ∈ S, f (r(t)) = k para todo t. Derivamos esta expresión usando la regla de la
cadena para obtener Df (r(t)).r0 (t) = 0 para todo t. En particular vale para t = t0 , es decir,
Df (r(t0 )).r0 (t0 ) = h∇f (x0 ), r0 (t0 )i = 0.
En otras palabras, podemos afirmar que el vector gradiente es ortogonal a las superficies de
nivel de la función en el punto.
Entonces podemos decir que “el gradiente de la función en un punto apunta en la dirección
de máximo crecimiento de la función en ese punto”.
Pueden visualizarse el gradiente y las curvas de nivel de una función escalar con dominio en
el plano en el siguiente recurso de Geogebra: https://www.geogebra.org/m/VKU7BrFK
∂g
Demostración: Supongamos que (x0 ) 6= 0. Entonces, por el teorema de la función
∂xn
implı́cita, existe una función h tal que g(x1 , ..., xn−1 , h(x1 , ..., xn−1 )) = 0 para todo (x1 , ..., xn−1 )
en un conjunto abierto U ⊂ Rn−1 . Sea k(x1 , ..., xn−1 ) = f (x1 , ..., xn−1 , h(x1 , ..., xn−1 )). Queremos
extremar k.
Si k tiene un máximo o un mı́nimo en un punto, entonces el gradiente es el vector nulo, es
decir, usando la regla de la cadena
∂k ∂f ∂f ∂h
= + = 0. (7.1)
∂xi ∂xi ∂xn ∂xi
Pero, por otro lado, como g(x1 , ..., xn−1 , h(x1 , ..., xn−1 )) = 0, tenemos que
∂g ∂g ∂h
+ = 0. (7.2)
∂xi ∂xn ∂xi
∂h
De modo que, despejando de (7.2) y reemplazando en (7.1), para todo 1 ≤ i ≤ n − 1, vale
∂xi
∂f ∂f
∂f ∂xn ∂g ∂xn
= . . Entonces, tomando λ= obtenemos que
∂xi ∂g ∂xi ∂g
∂xn ∂xn
∂f ∂g
(x0 ) = λ (x0 ) para todo 1 ≤ i ≤ n − 1 y trivialmente de la definición de λ se verifica
∂xi ∂xi
para las derivadas parciales respecto a xn , consecuentemente, ∇f (x0 ) = λ∇g(x0 ).
Definición 7.3.3 A la constante λ tal que ∇f (x0 ) = λ∇g(x0 ) cuya existencia se mostró en el
teorema (7.3.2) se la llama multiplicador de Lagrange.
Estos resultados nos dicen que para determinar los extremos con restricciones de f, debemos
buscar entre los puntos x0 que satisfacen las conclusiones del teorema o del corolario. Cuando se
usa el método del teorema (7.3.2), debemos buscar un punto x0 y una constante λ de modo que
∇f (x0 ) = λ∇g(x0 ).
Veremos ahora un algoritmo para hallar efectivamente los puntos extremos del caso general
de una función f restringida a una superficie S definida por varias restricciones,
g1 (x1 , . . . , xn ) = c1
g2 (x1 , . . . , xn ) = c2
..
.
gn (x1 , . . . , xn ) = ck
Este resultado se puede demostrar generalizando el método utilizado para demostrar el teo-
rema (7.3.2) pero no lo haremos con detalle en este curso.
Nos proponemos probar que para hallar los puntos a = (a1 , . . . , an ) ∈ S, donde f |S tiene un
extremo, se tiene el siguiente algoritmo:
1. Se hallan las soluciones (a1 , . . . , an , λ1 , . . . , λm ) del sistema
m
∂F ∂f X ∂g
= (a1 , . . . , an ) + λi (a1 , . . . , an ) = 0
∂x1 ∂x1 i=1 ∂x1
..
.
m
∂F ∂f X ∂g
= (a1 , . . . , an ) + λi (a1 , . . . , an ) = 0
∂xm ∂xm ∂xm
i=1
(7.3)
∂F
= g1 (a1 , . . . , an ) = 0
∂λ1
..
.
∂F
= gm (a1 , . . . , an ) = 0
∂λm
Observemos que las m últimas ecuaciones son equivalentes simplemente a que (a1 , . . . , an ) ∈
S.
xi = ψi (xm+1 , . . . , xn ), i = 1, 2, . . . , m
3. Se escribe el sistema
∂g1 ∂g1
(a1 , . . . , an ) dψ1 + · · · + (a1 , . . . , an ) dψm +
∂x1 ∂xm
∂g1 ∂g1
(a1 , . . . , an ) dxm+1 + · · · + (a1 , . . . , an ) dxn = 0
∂xm+1 ∂xn
.. ..
. .
∂gm ∂gm
(a1 , . . . , an ) dψ1 + · · · +
(a1 , . . . , an ) dψm +
∂x1 ∂xm
∂gm ∂gm
(a1 , . . . , an ) dxm+1 + · · · + (a1 , . . . , an ) dxn = 0
∂xm+1 ∂xn
y se despejan dψ1 (a), . . . , dψm (a) como combinaciones lineales de dxm+1 , . . . , dxn , digamos
∂ψ1 ∂ψ1
dψ1 (a) = (a) dxm+1 + · · · + (a) dxn
∂xm+1 ∂xn
..
.
∂ψm ∂ψm
(a) dxm+1 + · · · +
dψm (a) = (a) dxn
∂xm+1 ∂xn
dxi = dψi , i = 1, 2, . . . , m
5. Luego se tiene
n
∂ 2F X ∂ 2F
D2 F = 2
X
2
(a) dx i + 2 (a) dxi dxj .
i=1 ∂xi i<j ∂xi ∂xj
De acuerdo con lo anterior, como dxi = dψ1 , . . . , dxm = dψm son formas lineales en
dxm+1 , . . . , dxn , se puede escribir
n
D2 F = aii dx2i + 2
X X
aij dxi dxj
i=m+1 i<j
∂F
pero como (a) = 0, resulta
∂xi
n
!2
2 2
X ∂ 2F 2
X ∂ 2F ∂ ∂
d f (a) = d F (a) = 2
(a)(dx i ) +2 (a)dx i dx j = dx 1 + · · · + dx n F (a).
i=1 ∂xi i<j ∂xi ∂xj ∂x1 ∂xn
Luego, reemplazando en la expresión anterior dxi = dψi , i = 1, . . . , m, resulta una forma cuadráti-
ca en dxm+1 , . . . , dxn .
Si el signo de esta forma cuadrática es positivo, f |S tiene un mı́nimo; y si es negativo, f |S
tiene un máximo.
Solo resta ver la recı́proca, es decir, si a = (a1 , . . . , an ) es un punto crı́tico de f |S entonces
existen λ1 , . . . , λm tales que (a1 , . . . , an , λ1 , . . . , λm ) satisfacen el sistema (7.3) del paso 1.
Es claro que (a1 , . . . , an ) satisface las últimas ecuaciones del sistema (7.3) por hipótesis. Solo
resta ver que el sistema lineal en λ1 , . . . , λm de las n > m primeras ecuacione es compatible. Eso
es ası́ por el siguiente resultado de álgebra lineal:
Sean αi : Rn → R funcionales lineales para 1 ≤ i ≤ m donde m < n y supongamos que una
funcional lineal h : Rn → R tiene la siguiente propiedad: Si x ∈ Rn satisface αi (x) = 0, i =
1, . . . , m, entonces h(x) = 0.
Bajo estas condiciones se prueba que existen λ1 , . . . , λm ∈ R tales que h = λ1 α1 + · · · + λm αm .
Aceptando esto, se ve que en nuestro caso dg1 (a), dg2 (a), . . . , dgm (a) m son funcionales
lineales de Rn en R.
Como
sabemos, la ecuación de la variedad lineal tangente a S en a es
∂g 1 ∂g1
(a)(x − a ) + · · · + (a)(xn − an ) = 0
1 1
∂x1 ∂xn
..
.
∂g ∂g
m m
(a)(x1 − a1 ) + · · · + (a)(xn − an ) = 0
∂x1 ∂xn
Si x(t) = (x1 (t), . . . , xn (t)) es una curva tal que x(0) = a y g1 (x(t)) = 0, . . . , gm (x(t)) = 0 (o
sea, si la curva está contenida en S) entonces derivando vale, para t = 0, que
∂g1 ∂g1
(a)x˙1 + · · · + (a)x˙n = dg1 = 0
∂x1 ∂xn
..
. (7.4)
∂gm ∂gm
(a)x˙1 + · · · +
(a)x˙n = dgm = 0
∂x1 ∂xn
∂f ∂f
df = (a)x˙1 + · · · + (a)x˙n = 0 (7.5)
∂x1 ∂xn
En resumen, ẋ(0) es un vector tangente a una curva contenida en S si y solo si satisface (7.4)
y esto implica que se satisface (7.5). Es decir, si las funcionales dg1 (a), . . . , dgm (a) se anulan en
x, entonces la funcional df (a) se anula en x. Luego, por el resultado de álgebra lineal, existen
λ1 , . . . , λn tales que df + λ1 dg1 + · · · + λm dgm = 0.
Enfatizaremos una vez más que pese a la introducción de las variables extras λ1 , . . . , λm , en la
práctica de los cálculos usar el método de los multiplicadores resulta más conveniente en muchos
casos.
Es claro que si se dispone de una parametrización sencilla del conjunto S definido por las
condiciones g1 = 0, . . . , gm = 0, entonces quizás no convenga aplicar el método de Lagrange. Tal
vez simplemente pueda considerarse la composición de la función f con la parametrización de S
y hallar los extremos de esa composición sin pensar en un caso de extremos restringidos.
Integrales múltiples
70
CAPÍTULO 8. INTEGRALES MÚLTIPLES
A continuación, vamos a definir las sumas superiores e inferiores de una función de dos
variables en forma análoga a como hicimos con una variable real.
Dado un rectángulo R, podemos siempre subdividirlo en una cantidad finita de rectángulos
más pequeños, es decir R = ∪i Ri donde los Ri son rectángulos (disjuntos salvo las fronteras) del
plano, como se ve en la siguiente figura:
El diámetro de una partición P que se nota δ(P ) (también llamado norma de la par-
tición y denotado kP k) es el máximo de los diámetros de todos los rectángulos que forman
la partición. Es una medida de que tan pequeños son los rectángulos de la partición: a menor
diámetro, más pequeños los rectángulos de la partición.
Observemos que dada una partición cualquiera P del rectángulo original R, y un número
positivo ε, siempre podemos obtener un refinamiento P0 de P de manera tal que δ(P0 ) < ε.
Definición 8.1.2 Cuando las integrales superior e inferior de Riemann coinciden, decimos que
f es Riemann integrable ZZen el rectángulo
Z R. A esta cantidad igual a la suma inferior o superior
de Riemann, la denotamos f o f , y la llamamos integral doble de f sobre R.
R R
Dada una función f que está definida en un dominio D ⊂ R2 acotado, pero que no es
necesariamente un rectángulo, consideramos la siguiente función auxiliar f definida como sigue.
Se toma un rectángulo cualquiera R tal que D ⊂ R y se define
(
f (X), si X ∈ D
f (X) =
0, si X ∈ R − D
Se definen las sumas superiores e inferiores de f como las sumas superiores e inferiores de f ,
y decimos que f es integrable en D si f es integrable en R.
Observación: Esta integral no depende del rectángulo elegido, por que si cambiamos el
rectángulo por otro que contenga a R, en la diferencia de ambos rectángulos la función f es nula.
En principio, hemos definido las sumas superior e inferior y, por lo tanto, la integral de
Riemann, solo para funciones positivas pero dada cualquier función acotada f definida en un
dominio acotado D, podemos considerar sus partes positiva y negativa dadas por
( (
f (X), si f (X) > 0 −f (X), si f (X) < 0
f+ (X) = y f− (X) = .
0, si f (X) ≤ 0 0, si f (X) ≥ 0
Ambas son funciones positivas para las que puede verse si son integrables Riemann y, entonces,
f es integrable Riemann en D si f+ y f− lo son. Como f = f+ − f− , vale que
Z Z Z
f= f+ − f−
D D D
Para poder afirmar si una función de dos variables es integrable en un cierto dominio, este
criterio nos obliga a hallar una partición de algún rectángulo que contenga el dominio de la
función que cumpla esa condición para las sumas superior e inferior, cosa que puede resultar
complicada en el caso de una función y un dominio cualquiera.
Nuestro próximo objetivo es probar un teorema que da condiciones suficientes para afirmar
la integrabilidad de una función en un dominio del plano cuyas condiciones son de verificación
más práctica. Para ello, analicemos en primer lugar cuál es el problema que surge al extender la
función f a la función f definida en un rectángulo que contiene al dominio D de f .
El problema que surge de la construcción es que la función extendida f ya no es continua en
R aunque lo sea en D, pues en la frontera de D tenemos un “salto”, aún en el caso en el que f
sea constante, como se observa en la siguiente figura
Proposición 8.1.5 Sea ϕ : [a, b] → R una función continua. Entonces dado ε > 0, existe
2
X conjunto finito de rectángulos Ri ⊂ R de manera que graf (ϕ) ⊂ Int(∪i Ri ), y ademas
un
µ(Ri ) = ε.
i
Demostración: Para simplificar los cálculos pero sin pérdida de generalidad, supongamos
que I = [0, 1].
Por ser ϕ continua en I, dado ε > 0, existe δ > 0 tal que |x−x0 | < δ implica |ϕ(x)−ϕ(x0 )| < 2ε .
Tomamos m ∈ N tal que m1 < δ, y particionamos el intervalo [0, 1] en m intervalos de igual
longitud m1 . En cada intervalo las imágenes de ϕ están contenidas en una banda de altura 2ε ,
como indica la figura:
Formamos los rectángulos Ri de base m1 y altura 2ε de manera que graf (ϕ) ⊂ ∪i Ri . Como
hay m rectángulos y cada uno de ellos tiene área = b.h = m1 . 2ε , se tiene que
X 1 ε ε
µ(Ri ) = m = .
i m 2 2
Como los rectángulos Ri son disjuntos, a menos de sus fronteras, puede suceder que el graf (ϕ)
pase exactamente por el vértice de dos rectángulos contiguos (en la forma que muestra la figura
siguiente) y entonces no esté totalmente contenido en el interior de la unión de los rectángulos
Ri ya que, al tomar la unión y luego el interior, ese punto queda sin cubrir.
Entonces, cubrimos esos puntos con rectángulos adicionales como muestra la figura que sigue.
De estos puntos conflictivos, hay a lo sumo m + 1. Cubrimos cada uno de ellos con un
1
rectángulo de base m+1 y altura 2ε , lo agregamos a la unión de rectángulos y entonces se tiene
que Gr(ϕ) ⊂ Int(∪i Ri ).
Por otro lado, las suma de las áreas de los primeros rectángulos da 2ε , mientras que la suma
de los rectángulos nuevos a lo sumo es
1 ε ε
(m + 1)b.h = (m + 1) = .
(m + 1) 2 2
Ası́, la suma total del área de los rectángulos que contienen al gráfico de ϕ es ε.
Recordemos que f integrable en un dominio D quiere decir que si consideramos un rectángulo
que incluya al dominio D y extendemos el dominio de f al rectángulo con valor 0 fuera de D,
entonces f es integrable en el rectángulo.
Entonces, como consecuencia de la proposición anterior, se tiene el siguiente teorema.
Tomamos ahora una partición P = {Ri }i∈F de R que contenga a los rectángulos {Ri }i∈A que
cubren la frontera de D (estamos subdividiendo aquellos rectángulos que estaban superpuestos
para pensarlos como rectángulos disjuntos), como muestra la figura:
ε ε ε
ε0 .µ(Ri ) ≤ s + ε0 µ(R) = +
X X
< s.µ(Ri ) + µ(R) = ε.
i∈A i∈F −A 2s 2 2µ(R)
Demostración: Consideremos una partición P del rectángulo, donde ∆i = [xi , xi+1 ] es una
partición de [a, b] y ∆0j = [yj , yj+1 ] es una partición de [c, d], de manera que los rectángulos
Rij = ∆i × ∆0j de área (xi+1 − xi )(yi+1 − yi ) forman la partición P del rectángulo original. Como
antes, abusamos un poquito de la notación y usamos ∆ para denotar al intervalo y a su longitud.
Entonces
donde mij (f ) indica el ı́nfimo de f en Rij . Si x ∈ Rij , entonces mj (fx ) (el ı́nfimo de fx en ∆0j ) es
mayor o igual que el ı́nfimo de f en Rij , pues
y el ı́nfimo en un subconjunto -en este caso {x} × ∆0j - siempre es mayor o igual que el ı́nfimo en
el conjunto original -en este caso ∆i × ∆0j . Se deduce que, cualquiera sea x ∈ ∆i ,
j j
mij (f )∆0 ∆i
X X X
I(f, P ) =
j ≤ mi (I)∆i ≤ I∗ (I),
i j i
es decir
I(f, P ) ≤ I∗ (I).
Con un razonamiento análogo se deduce que I ∗ (I) ≤ S(f, P ). Luego, como I∗ (I) ≤ I ∗ (I), se
obtiene la cadena
I(f, P ) ≤ I∗ (I) ≤ I ∗ (I) ≤ S(f, P ).
Como f es integrable, los extremos se pueden hacer tan próximos como querramos refinando la
partición P, y en consecuencia debe ser
Z Z b
∗
f = I∗ (I) = I (I) = I(x) dx,
R a
lo que prueba que I es integrable en [a, b], con integral igual a la integral doble de f .
La prueba para la integral de S es idéntica y la omitimos, lo mismo vale para las afirmaciones
respecto de fy .
Aquı́ las superficies reemplazan a las curvas como frontera de la región, y la idea central es
que una superficie en R3 , que es gráfica de una función continua en un compacto, tiene volumen
nulo y, por lo tanto, la frontera de la región no influye en la existencia de la integral.
Respecto del cálculo, en el caso de dominios de R3 hay más posibilidades que en el caso de R2 ,
simplemente por ser tres las variables. Las distintas posibilidades se observan en las siguientes
figuras.
En el primer caso, se trata de de la región encerrada por los gráficos de funciones fi (x, y),
cuyo dominio común A se indica como una sombra en el plano xy. En los otros casos se tienen
las variantes obvias.
8.4. Integrales en Rn
Demostración: Hay que observar que si f es continua, entonces es continua en cada una de
sus variables por separado, y entonces cada
Z bi
f (x1 , x2 , . . . , xn ) dxi
ai
existe y es una función continua en [ai , bi ], en particular integrable. Usando el teorema de Fubini
repetidas veces se obtiene el corolario.
Si existe, en el plano esta integral nos devuelve la superficie de la región D, mientras que en
el espacio nos devuelve el volumen de la regiónn D.
¿Podemos dar condiciones para que esta integral exista? Sı́, es sencillo en este momento, pues
la función 1 es continua y, por lo tanto, se tiene el siguiente resultado.
Teorema 8.4.3 Sea D ⊂ Rn compacto, f : D → R continua, y supongamos que ∂D esta
formado por una unión finita de gráficos de funciones Zϕ : Ki ⊂ Rn−1 → R continuas, con Ki
compactos. Entonces f es integrable en D, y además f se puede calcular con n integrales
D
iteradas.
En particular, D es medible y
Z
µ(Rj∗ ).
X X
µ(D) = 1 = sup µ(Ri ) = inf
D
(∪Ri )⊂D D⊂(∪Rj∗ )
Demostración: Lo único que resta probar sonZ las últimas igualdades que dan µ(D) y son
consecuencia del siguiente hecho: para calcular 1 tomamos un rectángulo R que contenga a
D
D, extendemos a la función como cero en R − D. Es decir, f = 1 en D y f = 0 en R − D. Luego,
particionamos R = ∪i Ri .
Para calcular integrales dobles, dado un dominio D ⊂ R2 con una frontera “buena”, lo que
hacemos es incluir el dominio D en un rectángulo de lados paralelos a los ejes y tomar una
partición de él. Sin embargo, la elección de estos rectángulos de lados paralelos a los ejes es, en
cierta medida, arbitraria. Podemos tomar paralelogramos, es decir, figuras de lados paralelos dos
a dos, y considerar una partición como indica la figura:
Puede probarse que existe la integral de f en D usando rectángulos paralelos a los ejes si y
sólo si existe la integral usando estos paralelogramos. La idea de por qué vale esto es la siguiente:
dado un rectángulo R de lados paralelos a los ejes, puede tomarse una partición del mismo usando
paralelogramos, que aproxime tanto como uno quiera al rectángulo R. Recı́procamente, dado un
paralelogramo R0 , se lo puede aproximar tanto como uno quiera usando rectángulos de lados
paralelos a los ejes.
Z
Vamos a usar este hecho: si f es integrable en D, entonces su integral f se puede calcular
D
considerando una familia o partición de paralelogramos Ri0 de un paralelogramo R0 que contenga
a la región D.
Dados dos vectores linealmente independientes en el plano, su imagen por una transformación
lineal T : R2 → R2 son otros dos vectores linealmente independientes. Entonces todo rectángulo
(o mejor dicho, todo paralelogramo) va a parar a otro paralelogramo.
Veamos la relación entre las áreas de un rectángulo R∗ y su imagen R = T (R∗ ) por una
transformación lineal T.
Pero entonces, dada cualquier figura D∗ ⊂ R2 que sea medible, si D = T (D∗ ) indica la imagen
de D∗ por una transformación lineal T inversible, podemos cubrir D∗ con rectángulos Ri∗ que
aproximen la figura, y ası́ estaremos llenando D = T (D∗ ) con paralelogramos Ri = T (Ri∗ ) que
aproximan esa figura, como en el dibujo que sigue:
µ(T (D∗ )) = lı́m µ(T (Ri∗ )) = lı́m |det(T )|µ(Ri∗ ) = |det(T )| µ(D∗ ).
X X X
µ(Ri ) = lı́m
Obsevemos la analogı́a en la fórmula del Teorema (8.5.2) con la fórmula del método de
sustitución para integrales en R.
Recordemos que si f es una función continua en un intervalo cerrado I ⊂ R, y g es una función
C 1 en [a, b] tal que se puede hacer la composición f ◦ g en [a, b], entonces h(x) = f (g(x))g 0 (x) es
una función integrable y además
Z b Z g(b)
f (g(x))g 0 (x) dx = f (u) du = F (g(b)) − F (g(a)) (8.1)
a g(a)
si F es una primitiva de f .
En este caso de una variable, |det(T )| juega el papel de g 0 .
Por ahora este teorema (8.5.2) tiene utilidad limitada. Lo que queremos es extender el re-
sultado a funciones inyectivas cuya diferencial sea inversible salvo un conjunto “muy peque˜no”
(con medida nula). Es decir, dado un dominio D∗ y una función T : R2 → R2 inyectiva, queremos
hallar primero la relación entre µ(D∗ ) y µ(T (D∗ )) = µ(D), y luego ver cuál es la relación entre
la integral de f en un dominio D∗ y la de f ◦ T en el otro dominio T (D∗ ).
Si T es una función inyectiva, el dominio D = T (D∗ ) se puede pensar cubierto con las
imágenes de los rectángulos que cubren D∗ , es decir si ∪i Ri∗ aproximan D∗ entonces ∪i T (Ri∗ )
aproximan D = T (D∗ ). ¿Cómo calcular la medida de cada T (Ri∗ )? En principio es un problema
difı́cil, ya que T no es lineal y cada Ri = T (Ri∗ ) está deformado de manera similiar a la que
muestra la figura:
µ(T (D∗ )) = µ(T (Ri∗ )) ≈ µ(DT (Pi )Ri∗ ) = |det(DT (Pi ))| µ(Ri∗ )
X X X
lı́m
∗
lı́m
∗
lı́m
∗
δ(Ri )→0 δ(Ri )→0 δ(Ri )→0
i i i
Z
= |det(DT | , es decir
D∗
Z
∗
µ(D) = µ(T (D )) = |det(DT )|.
D∗
JT = JKH .JH.
donde Iv es el intervalo dado por la imagen de [a, b] via g1 (u, v) con v ∈ [c, d] fijo, según indica
la figura (pues H fija [c, d]):
Con una cuenta análoga se tiene, para cualquier entorno abierto V ∗ de H(P ) suficientemente
pequeño, Z Z
f= (f ◦ K)JK.
K(V ∗ ) V∗
Luego Z Z Z
f= f= (f ◦ K)JK.
T (R∗ ) K◦H(R∗ ) H(R∗ )
Z Z
Llamando g = (f ◦ K) JK y usando que g= (g ◦ H) JH se deduce que
H(W ∗ ) W∗
Z Z
(f ◦ K) JK = (f ◦ K ◦ H) JKH JH.
H(R∗ ) R∗
Como DT (X) = DKH(X) DH(X), tomando determinante a ambos miembros se tiene que
JKH .JH = JT (donde ahora con JKH notamos al Jacobiano de K, evaluado en H) y juntando
las últimas dos ecuaciones se tiene
Z Z
f= (f ◦ T ) JT.
T (R∗ ) R∗
Por último, si DT (p) 6= I2 , basta llamar A = DT (p) que es una transformación lineal inver-
sible, y definiendo T := A−1 ◦ T se tiene
Z Z Z
f= f= (f ◦ A) |det(A)|,
T (R∗ ) A◦T (R∗ ) T (R∗ )
Finalmente, usando las mismas ideas que antes, toda función inyectiva T : R3 → R3 con
diferencial inversible nos permite hacer un cambio de variable que transforma una integral en D∗
en una integral en D = T (D∗ ) de la siguiente manera.
Teorema 8.6.2 Sea T : R3 → R3 una función inyectiva y de clase C 1 . Sea D∗ ⊂ R3 un
conjunto acotado y una función f : D = T (D∗ ) → R integrable. Si DT es inversible en D∗ y
JT = |det(DT )|, entonces Z Z
f= (f ◦ T ) JT.
D D∗
La demostración usa las mismas ideas que el caso n = 2 y la omitimos. El único comentario a
tener en cuenta es que ahora hay que descomponer T como una aplicación que primero depende
de dos variables y después de una, y usar el resultado que ya tenemos para dos variables. Es
decir, es un resultado general que se prueba por inducción sobre el número de variables.
Integrales curvilı́neas
Proposición 9.1.2 Sean x = f (t), t ∈ [a, b], una curva en Rn , C = f ([a, b]) ⊆ Rn la imagen de
x y x = g(u), u ∈ [c, d], otra parametrización de C, tal que f y g son inyectivas. Entonces existe
una correspondencia biunı́voca entre los parámetros t y u dada por f (t) = g(u) ∈ C. O sea, se
tiene la función t = ϕ(u), ϕ : [c, d] → [a, b] tal que f (ϕ(u)) = g(u).
Más aún, resulta que ϕ tiene derivada continua.
Demostración: Como f 0 (t0 ) 6= 0 para t0 ∈ [a, b], resulta que fi0 (t0 ) 6= 0 para algún i =
1, 2, . . . , n. Entonces, por el teorema de la función inversa, la función xi = fi (t) tiene inversa en
un entorno de x0i = fi (t0 ), digamos t = hi (xi ), la cual tiene derivada continua en un entorno de
x0i . Ahora xi = gi (u), luego t = hi (gi (u)) = ϕ(u).
Como hi , gi tienen derivadas continuas, lo mismo sucede con t = ϕ(u). Además, observemos
que como fi (ϕ(u)) = gi (u), resulta ϕ(u0 ) = t0 , fi0 (t0 ).ϕ0 (u0 ) = gi0 (u0 ). Luego gi0 (u0 ) 6= 0, ya que
ϕ0 (u0 ) 6= 0.
Definición 9.1.3 Si ϕ0 (u) > 0, se dice que ambas parametrizaciones f y g recorren la curva
C en el mismo sentido. Si ϕ0 (u) < 0, se dice que las parametrizaciones f y g recorren C en
sentido contrario.
Definición 9.2.1 Llamaremos un arco de curva regular o curva regular a una curva
f : (a, b) → U ⊂ Rn siendo U un conjunto abierto y f una función inyectiva.
90
CAPÍTULO 9. INTEGRALES CURVILÍNEAS
También llamaremos curva regular “con borde” a una función f : [a, b] → Rn que es la
restricción de una función f : (a − ε, b + ε) → Rn con derivada continua f 0 (t) y con f 0 (t) 6= 0
para t ∈ (a, b).
Definición 9.2.2 Una curva continua f : (a, b) → Rn se dice regular a trozos si existe una
partición a = t0 < t1 < t2 < . . . < tn = b tal que f (ti−1 , ti ) es regular para 1 ≤ i ≤ n. Es decir,
el conjunto C ⊆ Rn se descompone en trozos C = C1 ∪ C2 ∪ . . . ∪ Cq ∪ . . . , de manera que cada
trozo Ci es parametrizable con una curva f (i) : [ai , bi ] → Ci ⊆ Rn y f (i) (bi ) = f (i+1) (ai+1 ) como
muestra la figura siguiente.
o sumas de ellas.
A veces es útil adoptar una notación más ágil para indicar las integrales curvilı́neas.
Z b Z
En lugar de escribir g(f (t))fi0 (t) dt se escribe simplemente g(x) dxi , donde C = f (a, b)
a C
es la imagen de f , teniendo en cuenta que xi = fi (t) y luego dxi = fi0 (t) dt.
Además, si C es la curva dada por la parametrización f (t), entonces −C es el mismo conjunto
de puntos descriptos por una parametrización h(u), donde u = ϕ(t) con ϕ0 < 0. Se tiene ası́ que
Z Z
g(x) dxi = − g(x) dxi .
C −C
El hecho de que las integrales curvilı́neas a lo largo de una curva no cambien cuando se cambia
la parametrización (sin cambiar el sentido de recorrido) justifica en parte esta notación, ya que
C puede ser parametrizada de distinto modo siempre que si ϕ es la relación entre los parámetros,
vale que ϕ0 > 0.
Corolario 9.2.7 Si C es una curva dada por la parametrización x = x(t), t ∈ [a, b], con x(a) =
x(b) (es decir, C es cerrada), entonces
Z
∂f ∂f
dx1 + . . . + dxn = 0.
C ∂x1 ∂xn
Observación: La condición
Z
f1 dx1 + . . . + fn dxn = 0, ∀ C cerrada (9.1)
C
La equivalencia entre las ecuaciones (9.1) y (9.2) está dada por el hecho de que si C1 , C2 son
como se ha indicado, entonces C = C1 + (−C2 ) es una curva cerrada.
Recı́procamente, toda curva cerrada C se descompone en dos trozos como se ha indicado.
Proposición 9.2.8 Sea U ⊂ Rn un conjunto abierto y arco-conexo. Supongamos que las fun-
ciones continuas P1 (x), . . . , Pn (x) tienen la propiedad de que si dos curvas regulares a trozos
C : x = x(t), t ∈ [a, b], C : x = x(t), t ∈ [a, b] tienen los mismos extremos x(a) = A =
x(a), x(b) = B = x(b), entonces
Z Z
P1 (x) dx1 + . . . + Pn (x) dxn = P1 (x) dx1 + . . . + Pn (x) dxn .
C C
∂f
Entonces existe una función f : U → R tal que Pi (x) = (x) para todo x ∈ U. En particular
∂xi
Df es continua.
El hecho de que la integral no dependa del camino que une A con z, nos dice que f está bien
definida.
Como U es abierto y z ∈ U, hay un entorno de z, digamos B(r, z) ⊂ U. Dado i = 1, 2, ..., n,
consideremos el vector hi = (0, 0, ..., ∆, ..., 0) donde las componentes de hi son todas nulas excepto
la i-ésima que vale ∆ < r. Entonces se puede “alargar” la curva C que une A con z, agregando
un segmento en la dirección del eje i-ésimo, definiendo la curva C dada por x : [a, b + ∆] → U
como sigue (
x(t), si t ∈ [a, b]
x(t) =
z + (t − b)hi , si t ∈ [b, b + ∆]
que resulta regular a trozos. Se tiene
Z Z b+∆
f (z + hi ) = P1 (x) dx1 + . . . + Pn (x) dxn = (P1 (x(t))x01 (t) + . . . + Pn (x(t))x0n (t)) dt =
C a
Z b
= (P1 (x(t))x01 (t) + . . . + Pn (x(t))x0n (t)) dt+
a
Z b+∆
+ (P1 (z + (t − b)hi )x01 (t) + . . . + Pn (z + (t − b)hi )x0n (t)) dt.
b
Luego,
f (z + hi ) − f (z) 1 Z b+∆
= (P1 (z + (t − b)hi )x01 (t) + . . . + Pn (z + (t − b)hi )x0n (t)) dt.
∆ ∆ b
Como x0i (t) = hi y x0j = 0 si j 6= i, resulta
f (z + hi ) − f (z) Z b+∆
= Pi (z + (t − b)ei ) dt.
∆ b
Observación: Se puede ver que los resultados de las proposiciones 9.2.6 y 9.2.8 valen igual-
mente aunque los trozos Ci de la curva no cumplan la condición x0 6= 0.
Integrales de superficie
se pueden despejar (s1 , s2 ) = ϕ(t1 , t2 ) y (t1 , t2 ) = ϕ−1 (s1 , s2 ) de dos de estas ecuaciones debido a
que Car(Df ) = 2.
∂(f , f )
i j
En efecto, dado (t1 , t2 ) ∈ U, sucede que algún Jacobiano (t1 , t2 ) 6= 0. Luego, en un
∂(t1 , t2 )
entorno de (xi , xj ) = (fi (t1 , t2 ), fj (t1 , t2 )) ∈ R2 se pueden despejar (por el teorema
de la función
∂(t , t )
1 2
inversa) (t1 , t2 ) = ψ(xi , xj ) = (ψ1 (xi , xj ), ψ2 (xi , xj )) con Jacobiano 6= 0 (probar como
∂(xi , xj )
ejercicio).
Luego, como xi = gi (s1 , s2 ), se tiene que
(t1 , t2 ) = (ψ1 (gi (s1 , s2 ), gj (s1 , s2 )), ψ2 (gi (s1 , s2 ), gj (s1 , s2 ))) = ϕ−1 (s1 , s2 ) = (ϕ−1 −1
1 (s1 , s2 ), ϕ2 (s1 , s2 ))
95
CAPÍTULO 10. INTEGRALES DE SUPERFICIE
Se encuentra (cómo se pueda!) el punto s = (s1 , . . . , sm ) ∈ V tal que xi = fi (t) = gi (s), para
i = 1, ..., m.
∂(f1 , . . . , fm ) ∂(g1 , . . . , gm )
Se calculan (t) y (s). Luego,
∂(t1 , . . . , tm ) ∂(s1 , . . . , sm )
∂(g , . . . , g )
1 m
(s)
∂(t , . . . , t )
1 m
∂(s1 , . . . , sm )
(s) = ∂(f , . . . , f ) .
∂(s1 , . . . , sm ) 1 m
(t)
∂(t1 , . . . , tm )
∂(t , . . . , t )
1 m
Si
(s) > 0, entonces f y g inducen la misma orientación en S y, si no, inducen
∂(s1 , . . . , sm )
orientaciones contrarias.
Definición 10.2.2 Una superficie regular con borde es la restricción de una superficie re-
gular f : U → Rn , f |D a una zona D ⊂ U, donde D es cerrada y la frontera de D es una curva
regular a trozos. Luego f |∂D es una curva regular a trozos en Rn .
Definición 10.2.3 Una superficie regular a trozos es un conjunto de superficies regulares
(i)
con borde f (i) : D → Rn , con i = 1, 2, 3, . . . , “pegadas por su borde”. Esto significa que
(i) (j) (i) (j)
f (i) (∂D ) ∩ f (j) (∂D ) = f (i) (D ) ∩ f (j) (D )
en donde estas intersecciones son también curvas regulares a trozos. Se nota
(i) (i)
S (i) = f (i) (D ) y ∂S (i) = f (i) (∂D ).
Por ejemplo, la superficie de un cono es regular a trozos siendo sus caras trozos regulares
pegados por sus bordes. La superficie de una esfera, se descompone como la reunión de dos
casquetes pegados por sus bordes (ecuador).
Definición 10.2.4 Una superficie regular a trozos S = S (1) + . . . + S (q) es orientable si sus
trozos S (i) se pueden orientar (es decir, se pueden reparametrizar) de modo que la orientación
inducida en los bordes sea “coherente”, esto es que cada borde esté “recorrido en sentido contrario
para cada trozo”.
Se puede ver que dada una zona V ⊂ R3 con borde ∂V , el borde (que se supone una superficie
regular a trozos ∂V = S1 + . . . + Sq ) tiene una orientación positiva “natural”. Esto es análogo a
dar una orientación positiva del borde ∂A de una zona plana, el que es una curva. La orientación
positiva “natural” está orientada positivamente, si el par (t, n) formado por el vector tangente
t y la normal interior →−
n está orientado positivamente. La manera de establecer la orientación
positiva de ∂V es la siguiente.
Definición 10.3.1 Sea f : D → Rn una superficie. Sea S = f (D) con la orientación inducida
por la parametrización f. Sea P : Rn → R una función de n variables dada y sean i, j ∈
(1, ..., n). Entonces la integral de superficie de la función P sobre la superficie S, que se nota
Z
P (x1 , ..., xn ) dxi dxj , se define como
S
Z Z
∂(xi , xj )
P (x1 , ..., xn ) dxi dxj = P (f (u, v)) dudv.
S D ∂(u, v)
Si S = S1 +S2 +...+Sq , donde los trozos Si son regulares y parametrizados con Si : f (i) : Di → Rn
coherentemente por los f (i) (para lo que S debe ser orientable!), entonces se define
Z Z Z Z
P dxi dxj = P dxi dxj + P dxi dxj + . . . + P dxi dxj .
S S1 S2 Sq
Nota: A los efectos del cálculo de integrales, es irrelevante que se considere o no el borde ya
que éste tiene medida nula.
Campos vectoriales
Pueden utilizarse distintos recursos de Geogebra para graficar campos vectoriales en el plano
y campos vectoriales en el espacio.
Para observar el comportamiento de un campo vectorial como un campo de velocidades de
sus lı́neas de flujo, puede verse el siguiente video de YouTube.
∂ϕ
Si F = (f1 , . . . , fn ) = ∇ϕ, es decir, fi = , por la igualdad de las derivadas cruzadas,
∂xi
resulta
∂fi ∂fj
= . (11.1)
∂xj ∂xi
101
CAPÍTULO 11. CAMPOS VECTORIALES
Se tiene ası́ que (11.1) es condición necesaria para que un campo vectorial F (con condiciones
de derivabilidad adecuadas, por ejemplo, con derivadas continuas) sea una campo de gradientes,
es decir, para que exista una función ϕ tal que ∇ϕ = F.
En lo que sigue nos ocuparemos de la recı́proca.
Supongamos que, para un campo vectorial F definido en un conjunto U ⊆ Rn abierto, vale la
condición (11.1). ¿Se puede concluir de aquı́ que existe un potencial ϕ : U → R tal que ∇ϕ = F ?
La respuesta a esta pregunta es que “depende de U ”. Veamos por qué.
Comencemos con un lema que nos permitirá probar el teorema que da las condiciones sufi-
cientes para la existencia de función potencial de un campo vectorial.
Lema 11.0.4 Sea h(x, y) una función continua en [a, b] × (c, d) y supongamos además que
Z b
hy (x, y) es continua en [a, b] × (c, d). Sea ϕ(y) = h(x, y) dx. Entonces ϕ tiene derivada
Z b a
0 0 ∂h
continua ϕ (y) en (c, d) y vale que ϕ (y) = dx.
a ∂y
Demostración: Tenemos
"Z #
ϕ(y + ∆) − ϕ(y) b Z b
1 Z b
h(x, y + ∆) − h(x, y)
= h(x, y + ∆) dx − h(x, y) dx = dx.
∆ a a ∆ a ∆
h(x, y + ∆) − h(x, y)
Por el teorema del valor medio, se tiene que = hy (x, ξ). Entonces
∆
ϕ(y + ∆) − ϕ(y) Z b Z b Z b Z b
− hy (x, y) dx = hy (x, ξ) dx − hy (x, y) dx = (hy (x, ξ) − hy (x, y)) dx
∆ a a a a
Z b
0
Es decir, ϕ (y) − hy (x, y) dx = 0.
a
( (
x1 = t x1 = x1
C1 : t ∈ [0, x1 ], C2 : t ∈ [0, x2 ].
x2 = 0 x2 = t
Z
Definamos ϕ : U → R mediante ϕ(x1 , x2 ) = f1 dx1 + f2 dx2 , es decir,
Z x1 Z x2 C
∂ϕ
y hay que verificar que (x) = fi (x).
∂xi
Teoremas integrales
Pero Z Z b Z Z b
K dx1 = K(t, ϕ(t)) dt y K dx1 = − K(t, ψ(t)) dt.
C1 a C2 a
Luego Z
∂K Z
dx1 dx2 = − K dx1 . (12.1)
U ∂x2 C
104
CAPÍTULO 12. TEOREMAS INTEGRALES
∂K1 ∂K2
Sea ahora K = (K1 , K2 ) un campo vectorial. La divergencia de K es ∇.K = + ,
! ∂x1 ∂x2
Z Z
∂K1 ∂K2
entonces ∇.K dx1 dx2 = + dx1 dx2 . Aplicando lo anterior resulta
U U ∂x1 ∂x2
Z
∂K1 Z Z
∂K2 Z
dx1 dx2 = K1 dx2 y dx1 dx2 = − K2 dx1 .
U ∂x1 ∂U U ∂x2 ∂U
Z Z
Luego, ∇.K dx1 dx2 = −K2 dx1 + K1 dx2 y, entonces, parametrizando ∂U con la longitud
U ∂U Z L
de arco S, resulta (llamando “L” a la longitud total de ∂U ) (−K2 x01 + K1 x02 ) ds donde
0
0 dxi
x = , i = 1, 2.
ds
Ahora el vector →− n = (x02 , −x01 ). Luego −K2 x01 + K1 x02 = hK, →
n normal exterior es →
− −
n i. Por
lo tanto, resulta
Z Z
∇.K dx dx = hK, → −
1n i ds
2 (12.2)
U ∂U
Se tiene entonces
Z ψ(x1 ,x2 )
Z
∂K Z
∂k
dx1 dx2 dx3 = dx1 dx2 dx3 =
U ∂x3 D ϕ(x1 ,x2 ) ∂x3
Z
= [K(x1 , x2 , ψ(x1 , x2 )) − K(x1 , x2 , ϕ(x1 , x2 ))] dx1 dx2 .
D
Ahora
Z Z
∂(x1 , x2 ) Z
K dx1 dx2 = K(u, v, ψ(u, v)) dudv = K(u, v, ψ(u, v)) dudv,
S2 D ∂(u, v) D
Z Z
∂(x1 , x2 ) Z
K dx1 dx2 = K(v, u, ϕ(v, u)) dudv = K(v, u, ϕ(v, u))(−1) dudv =
S1 D ∂(u, v) D
Z Z
=− K(v, u, ϕ(v, u)) dudv = − K(u, v, ϕ(u, v)) dudv.
D D
Z Z
Luego, Kdx1 dx2 = [K(x1 , x2 , ψ(x1 , x2 )) − K(x1 , x2 , ϕ(x1 , x2 ))] dx1 dx2 y, por lo tanto,
S D
Z
∂K Z
dx1 dx2 dx3 = K dx1 dx2 . (12.3)
U ∂x3 ∂U
∂K ZZ
dx1 dx2 dx3 = K dx2 dx3 .
U ∂x1 ∂U
q Z
X
= f1 dx2 . . . dxn − f2 dx1 dx3 . . . dxn + f3 dx1 dx2 dx4 . . . dxn + . . . =
j=1 Dj
q Z n
ˆ i . . . dxn (−1)i−1 .
X X
fi dx1 . . . dx
j=1 Dj i=1
12.2. Flujo
Sea F = (f1 , f2 , f3 ) un campo vectorial en U ⊆ R3 y sea S una superficie, y supongamos
S orientada. De modo que si x = x(u, v) es una parametrización positiva de un trozo, entonces
queda determinado un sentido para la normal
→
− xu (u, v) × xv (u, v)
n (x(u, v)) = ,
k xu (u, v) × xv (u, v) k
Definición 12.2.1 Se llama flujo de un campo vectorial F a través de una superficie S (con el
sentido de →
−
n elegido) a la integral
Z
hF, →
−
n i ds := F lujo.
S
Se comprueba que
Z " #
Z Z
∂(x2 , x3 ) ∂(x3 , x1 ) ∂(x1 , x2 )
hF, →
−
n i ds = hF, xu × xv i dudv = f1 + f2 + f3 dudv =
S S S ∂(u, v) ∂(u, v) ∂(u, v)
Z
= f1 dx2 dx3 + f2 dx3 dx1 + f3 dx1 dx2 .
S
Luego, podemos enunciar también el teorema de la divergencia como: La integral de la
divergencia de un campo vectorial F sobre una región U es igual al flujo de F a través del borde
∂U de U , donde ∂U se orienta con la normal exterior.
12.3. Rotor
Sea F = (f1 , f2 , f3 ) un campo vectorial definido en un conjunto abierto U ⊆ R3 .
∂ ∂ ∂
Trabajando formalmente con ∇ = → −e1 +→ −
e2 +→
−
e3 como si fuese un vector de
∂x1 ∂x2 ∂x3
∂ ∂ ∂
componentes , , , el segundo miembro también se puede escribir como el determi-
∂x1 ∂x2 ∂x3
nante →
− →
−
e2 → −
e1 e 3
∂ ∂ ∂
∂x1 ∂x2 ∂x3
f1 f2 f3
que hay que desarrollar por la primera fila.
1. ∇ × (f + g) = ∇ × f + ∇ × g.
2. ∇ × (ϕf ) = ∇ϕ × f + ϕ(∇ × f ).
3. ∇ × ∇ϕ = 0.
4. ∇(∇ × ϕ) = 0.
Esta fórmula también se puede escribir, llamando (K1 , K2 ) ≡ (A2 , −A1 ), como la siguiente
igualdad conocida como Fórmula de Green.
!
Z
∂A2 ∂A1 Z
− dx1 dx2 = A1 dx1 + A2 dx2
U ∂x1 ∂x2 ∂U
Equivalentemente,
! !
Z Z
∂x1 ∂x2 ∂x3 ∂x1 ∂x2 ∂x3
h∇×H, xu ×xv i dudv = H1 + H2 + H3 du+ H1 + H2 + H3 dv.
S ∂U ∂u ∂u ∂u ∂v ∂v ∂v
El teorema de Stokes se generaliza fácilmente para el caso de una superficie S regular a trozos,
con borde regular a trozos. Como consecuencia, una superficie cerrada regular a trozos S se puede
considerar como una superficie de borde ∂S vacı́o y entonces se tiene
→
−
Z Z
→
−
h∇ × H, n i dS = hH, t i ds = 0 (la demostración de esto no es sencilla).
S ∂S
[1] R.G. Bartle. The Elements of Real Analysis. John Wiley and Sons, Inc., First Edition, 1964.
[2] W.E. Boyce and R.C. DiPrima. Ecuaciones diferenciales y problemas con valores en la
frontera. Limusa-Willey, Cuarta Edición, 1964.
[4] G. Larotonda. Cálculo y Análisis. Universidad de Buenos Aires, cursos de grado, fascı́culo 3,
Edición 2010.
[5] J.E. Marsden and M.J. Hoffman. Análisis clásico elemental. Addison-Wesley Iberoamericana,
Segunda Edición, 1998.
[6] W. Mora. Cálculo en varias variables. Revista digital Matemática, Eduacación e Internet.
Instituto Tecnológico de Costa Rica, Segunda Edición, 2019.
[7] R.K. Nagle, E.B. Saff, and A.D. Snider. Fundamental of Differential Equations. Addison
Wesley, Eighth Edition, 2012.
112