Notas de Análisis Matemático II

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 113

NOTAS DE CLASE - ANÁLISIS II

(Complementario de Análisis Matemático II)

Viviana Alejandra Dı́az


viviana.diaz@uns.edu.ar
Departamento de Matemática
Universidad Nacional del Sur
Bahia Blanca, Argentina

8 de septiembre de 2020
2020
c Viviana Alejandra Dı́az
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.

1
Índice general

1. Ecuaciones diferenciales ordinarias 4


1.1. Interpretación geométrica de las ecuaciones diferenciales . . . . . . . . . . . . . . 5
1.2. Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1. Teorema de existencia y unicidad de las soluciones . . . . . . . . . . . . . . 8

2. Nociones de topologı́a en Rn 10
2.1. Función distancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2. Bolas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3. Conjuntos acotados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Conjuntos abiertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5. Interior de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6. Conjuntos cerrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7. Conjuntos compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.8. Puntos de acumulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.9. Clausura de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.10. Frontera de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.11. Convexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.12. Conexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.13. Arco-conexidad de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3. Diferenciabilidad de funciones de varias variables 24


3.1. Transformaciones diferenciables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3. Representación matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4. Condiciones para la diferenciabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4.1. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5. Derivadas direccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.6. La regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.7. La regla del producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4. Derivadas de orden superior y teorema de Taylor 39


4.1. Diferencial segunda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2. Teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5. Teoremas de la función inversa e implı́cita 45


5.1. Teorema del valor medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.2. Teorema de la función inversa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.3. Teorema de la función implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

2
6. Sucesiones y continuidad 53
6.1. Sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.2. Funciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

7. Extremos de funciones de varias variables 57


7.1. Extremos absolutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.2. Extremos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.3. Extremos condicionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.3.1. Geometrı́a de los gradientes . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.3.2. Extremos restringidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

8. Integrales múltiples 70
8.1. Integrales en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.1.1. Rectángulos y particiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.1.2. Integral de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.1.3. Dominios generales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.2. Integrales iteradas y teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3. Integrales en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4. Integrales en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.4.1. Medida de una región . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.5. Cambio de variables en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.5.1. Particiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.5.2. Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
8.5.3. Cambio de variables, versión lineal . . . . . . . . . . . . . . . . . . . . . . 84
8.5.4. Cambio de variables, versión general . . . . . . . . . . . . . . . . . . . . . 85
8.6. Cambio de variables en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

9. Integrales curvilı́neas 90
9.1. Orientación de curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
9.2. Integrales de lı́nea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

10.Integrales de superficie 95
10.1. Orientación de superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
10.2. Orientabilidad de superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
10.3. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
10.3.1. Generalización a más dimensiones . . . . . . . . . . . . . . . . . . . . . . . 99

11.Campos vectoriales 101

12.Teoremas integrales 104


12.1. Teorema de la divergencia o de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . 104
12.2. Flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
12.3. Rotor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
12.4. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

Viviana A. Dı́az - Departamento de Matemática, UNS 3


Capı́tulo 1

Ecuaciones diferenciales ordinarias

Siempre que un modelo matemático implique la razón de cambio de una variable con res-
pecto de otra, es probable que aparezca una ecuación diferencial. Las ecuaciones diferenciales
surgen en una amplia gama de áreas, no sólo en las ciencias fı́sicas, sino también en campos tan
diversos como la economı́a, la biologı́a, la medicina, la quı́mica, la electrónica, la psicologı́a y la
investigación operativa.
Cuando se plantean en términos matemáticos muchos problemas importantes y significativos
de estas ciencias, se requiere determinar una función que satisfaga una ecuación que contiene una o
más derivadas de la función desconocida. Estas ecuaciones se denominan ecuaciones diferenciales.
Quizás el ejemplo más conocido es la ley de Newton
!
d2 u(t) du(t)
m 2
= F t, u(t), , es decir, F = ma (1.1)
dt dt

para la posición u(t) de una partı́cula sobre la que actúa una fuerza F, que puede ser una función
du(t)
del tiempo t, de la posición u(t) y de la velocidad . Para determinar el movimiento de una
dt
partı́cula sobre la que actúa una fuerza F es necesario hallar una función u(t) que satisfaga la
ecuación (1.1).
Aunque para muchas ecuaciones es posible verificar que ciertas funciones sencillas son so-
luciones, en general no se obtienen con facilidad esas soluciones. Por lo tanto, una pregunta
fundamental es: dada una ecuación de la forma

y (n) = f (x, y, y 0 , y 00 , ..., y (n−1) ), (1.2)

¿es posible decir si la ecuación tiene una solución? Este es el problema de la existencia de
una solución. El hecho de que se haya escrito una ecuación de la forma (1.2) no necesariamente
significa que exista una función y(x) tal que f (x, y, y 0 , ..., y (n−1) ) − y (n) = 0 se satisfaga. De hecho,
no todas las ecuaciones diferenciales tienen soluciones.
En segundo lugar, suponiendo que una ecuación dada tiene una solución, ¿tendrá otras solu-
ciones? Esta es la cuestión de la unicidad. En caso de que la ecuación tenga más de una solución,
¿qué tipo de condiciones adicionales son necesarias para obtener una solución especı́fica?
Las cuestiones de existencia y unicidad son difı́ciles de responder.
Una tercera pregunta, más práctica, es: dada una ecuación diferencial del tipo de la ecuación
(1.2), ¿cómo se determina realmente una solución? Obviamente, si se encuentra una solución de
la ecuación dada, al mismo tiempo se responde la pregunta de la existencia de una solución.
Por otra parte, aunque fuese posible saber que existe una solución de una ecuación diferencial

4
CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS

(demostrando su existencia sin necesidad de encontrarla), puede ser que ésta no sea expresable
en términos de las funciones elementales usuales: funciones polinomiales, trigonométricas, expo-
nenciales, logarı́tmicas e hiperbólicas. No obstante, esto es lo que sucede para la mayor parte de
las ecuaciones diferenciales. De hecho, una ecuación diferencial puede ser muy compleja y difı́cil
de analizar.

1.1. Interpretación geométrica de las ecuaciones diferen-


ciales
Vale la pena hacer algunos comentarios acerca de la interpretación geométrica de las ecua-
ciones diferenciales y sus soluciones. Un punto de vista geométrico es particularmente útil para
las ecuaciones de primer orden, es decir, ecuaciones de la forma
dy
= f (x, y). (1.3)
dx
Dado que una solución de la ecuación (1.3) es una función y = y(x), la representación geométrica
de una solución es la gráfica de una función. Geométricamente, en la ecuación (1.3) se afirma
dy
que, en cualquier punto (x, y) la pendiente de la solución en ese punto está dada por la
dx
función f (x, y). Esto puede representarse con un pequeño segmento rectilı́neo que pase por el
punto (x, y) con pendiente f (x, y) ∈ R. La colección de todos esos segmentos rectilı́neos se llama
campo direccional de la ecuación diferencial (1.3). El campo direccional puede observarse
si se trazan pequeños segmentos rectilı́neos en algún conjunto representativo de puntos en el plano
XY. Aunque hacer esto manualmente es tedioso, resulta una tarea sencilla para una computadora,
ya que sólo se requiere la evaluación repetida de f (x, y) para valores diferentes de x e y.

Por ejemplo, puede utilizarse el software libre Geogebra y uno de sus recursos públicos
(https://www.geogebra.org/m/kpp3FjBh) para graficar el campo de velocidades de una ecua-
ción diferencial de primer orden del tipo (1.3).
dy 3−y
Veamos en la figura que sigue el caso del campo direccional de la ecuación =
dx 2
eligiendo, como es usual, una rejilla rectangular de puntos.

Viviana A. Dı́az - Departamento de Matemática, UNS 5


CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS

3−y
Para esta ecuación, f (x, y) = sólo depende de y, de modo que los segmentos rectilı́neos
2
tienen la misma pendiente en todos los puntos sobre cualquier recta paralela al eje x. Por ejemplo,
sobre la recta y = 2 la pendiente de cada segmento rectilı́neo es 12 .

dy
Cualquier solución de la ecuación general = f (x, y) tiene la propiedad de que, en
dx
todo punto, su gráfica es tangente al elemento del campo direccional en ese punto. Por tanto, a
partir de la observación de los campos direccionales de la ecuación diferencial es posible deducir
el perfil general de las soluciones, es decir, el campo direccional proporciona una información
cualitativa acerca de las curvas solución e incluso de regiones del plano que tienen algún interés
especial.
Por ejemplo, con base en la Figura (1.1) parece evidente que las soluciones son funciones
decrecientes cuando y > 3, que son crecientes cuando y < 3, y que, aparentemente, todas las
soluciones tienden al valor 3 cuando x → +∞.
La interpretación geométrica de la ecuación (1.3) es una familia infinita de curvas, pues
al conocer la derivada de la función solución, conoceremos y(x) a menos de una constante de
integración. A menudo, a estas curvas se les da el nombre de curvas integrales. Algunas veces
es importante elegir un elemento especı́fico de la familia de curvas integrales. Lo anterior se lleva
a cabo al identificar un punto particular (x0 , y0 ) por el que se requiera que pase la gráfica de la
solución. Este requisito suele expresarse como y(x0 ) = y0 y se denomina condición inicial. Una
ecuación diferencial de primer orden, como la (1.3), junto con una condición inicial constituyen
lo que se llama un problema con valor inicial.

Ejercicio: Plantear la ecuación diferencial cuyas soluciones son las curvas tales que en cada
punto (x, y) la pendiente de la recta tangente sea igual al cubo de la abscisa en dicho punto.
1. Graficar con GeoGebra el campo de direcciones de la ecuación diferencial planteada.
2. Hallar analı́ticamente las soluciones de la ecuación diferencial y observar la relación entre
las curvas solución y el campo de direcciones (si puede comentar algo de lo que observa,
coméntelo).
3. ¿Cuál de las curvas solución pasa por el origen?

1.2. Ecuaciones diferenciales de primer orden


Estudiaremos algunas ecuaciones diferenciales de primer orden de la forma
dy
= f (x, y), (1.4)
dx
sin embargo, para una función arbitraria f no existe un método general satisfactorio para resolver
esta ecuación en términos de funciones elementales. En lugar de ello se tienen varios métodos,
cada uno de los cuales es aplicable a cierta clase de ecuaciones de la forma (1.4).
Consideremos la ecuación lineal de primer orden
y 0 + p(x)y = g(x), (1.5)
donde p y g son funciones continuas dadas, definidas en algún intervalo α < x < β.

Viviana A. Dı́az - Departamento de Matemática, UNS 6


CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS

Se multiplica la ecuación (1.4) por una función µ(x), que por el momento no está determinada.
Entonces, se tiene
µ(x)y 0 + µ(x)p(x)y = µ(x)g(x). (1.6)
El objetivo es elegir µ(x) de modo que el primer miembro de la ecuación (1.6) sea la derivada de
alguna función. El término µ(x)y 0 sugiere que la función deseada (de la que el primer término es
su derivada) podrı́a ser el producto µ(x)y. Una función µ(x) que tenga esta propiedad se llama
factor integrante.
A fin de obtener la combinación (µ(x)y)0 = µ0 (x)y + µ(x)y 0 es necesario sumar y restar el
término µ0 (x)y en el primer miembro de la ecuación (1.6); al hacerlo y agrupar los términos de
manera conveniente, se obtiene

(µ0 (x)y + µy 0 ) − (µ0 (x) − p(x)µ(x))y = µ(x)g(x) (1.7)

Ahora, si el segundo término del primer miembro de la ecuación (1.7) fuese cero, entonces esta
ecuación tendrı́a la forma
(µ(x)y)0 = µ(x)g(x), (1.8)
y el primer miembro (por lo menos) serı́a fácilmente integrable. A fin de lograr lo anterior, debe
elegirse µ de modo que
µ0 (x) − p(x)µ(x) = 0. (1.9)
µ0 (x)
Si se supone que µ(x) es positiva, entonces la ecuación (1.9) puede escribirse como = p(x),
µ(x)
d Z
o bien ln(µ(x)) = p(x). Por lo tanto, ln(µ(x)) = p(x) dx + k, siendo k la constante de
dx
integración.
Al elegir la constante k como cero, se obtiene la función para µ, a saber
Z  R
p(x) dx
µ(x) = exp p(x) dx = e (1.10)

Observemos que µ(x) es positiva para todo x, como se supuso.


Una vez que se ha encontrado la función µ(x), se regresa a la ecuación (1.5) y se multiplica
por µ(x), obteniéndoseZ ası́ la ecuación (1.8). Al integrar ambos miembros de la ecuación (1.8) se
obtiene µ(x)y(x) = µ(x)g(x) dx + c, siendo c la constante de integración, o bien
Z
µ(x)g(x) dx + c
y(x) = . (1.11)
µ(x)

Como y(x) representa cualquier solución de la ecuación (1.5), se concluye que toda solución
de la ecuación (1.5) está incluida en la expresión del segundo miembro de la ecuación (1.11). Por
consiguiente, esta expresión se conoce como solución general de la ecuación (1.5).
Observemos que para encontrar la solución dada por la ecuación (1.11) se requieren dos
integraciones: una para obtener µ(x) a partir de la ecuación (1.10) y otra para determinar y(x)
a partir de la ecuación (1.11). También, observemos que antes de calcular el factor integrante
µ(x) a partir de la ecuación (1.10), es necesario asegurarse de que la ecuación diferencial esté
exactamente en la forma (1.5); especı́ficamente, el coeficiente de y 0 debe ser uno. En caso contrario,
la p(x) usada para calcular µ(x) será incorrecta. En segundo lugar, después de encontrar µ(x) y

Viviana A. Dı́az - Departamento de Matemática, UNS 7


CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS

multiplicar la ecuación (1.5) por ella, es necesario tener la certeza de que los términos en los que
aparecen y e y 0 son, en efecto, la derivada de µ(x)y, como debe ser.
Por supuesto, una vez que se ha encontrado la solución y(x), también puede verificarse sus-
tituyéndola en la ecuación diferencial.
Una vez conocida la solución general y(x) de la ecuación diferencial dada por la fórmula
(1.11), si se está en presencia de un problema con valor inicial y se tiene, por lo tanto, una
condición inicial que determina el valor de y(x) para un x = x0 en particular, puede obtenerse
el valor de c en (1.11) y la correspondiente solución del problema con valor inicial.

Ejercicio: Determinar la solución del problema con valor inicial y 0 + 2y = e−x con y(0) = 43 .

1.2.1. Teorema de existencia y unicidad de las soluciones

Aunque es cierto que no toda ecuación diferencial tiene soluciones (por ejemplo, es obvio que
la ecuación diferencial (y 0 )2 + 1 = 0 carece de soluciones reales), las ecuaciones diferenciales que
se encuentran en la práctica tienen, en general, muchas soluciones.
Anteriormente se mostró cómo construir soluciones de una ecuación diferencial lineal de pri-
mer orden con valor inicial, mediante el uso de un factor integrante para cambiar la ecuación
diferencial por una forma integrable. A continuación veremos algunas cuestiones de carácter más
general respecto a las ecuaciones del tipo y 0 + p(x)y = g(x) con valor inicial, intentando
contestar las preguntas:

¿Un problema con valor inicial de este tipo siempre tiene una solución?

¿Es posible que el problema con valor inicial tenga más de una solución?

¿Es válida la solución para todo x ∈ R o sólo para algún intervalo alrededor del punto
donde se tiene la condición inicial?

El teorema que sigue da las condiciones bajo las cuales un problema con valores iniciales de
una ecuación lineal de primer orden siempre tiene una, y sólo una, solución.

Teorema 1.2.1 Si las funciones p(x) y g(x) son continuas en un intervalo abierto α < x < β
que contiene al punto x = x0 , entonces existe una función única y(x) que satisface la ecuación
diferencial
y 0 + p(x)y = g(x) (1.12)
para α < x < β, y que también satisface la condición inicial

y(x0 ) = y0 , (1.13)

donde y0 es un valor inicial prescrito arbitrariamente.

La demostración de este teorema está parcialmente contenida en el análisis de la sección


anterior que llevó a la fórmula Z
µ(x)g(x) dx + c
y= (1.14)
µ(x)

Viviana A. Dı́az - Departamento de Matemática, UNS 8


CAPÍTULO 1. ECUACIONES DIFERENCIALES ORDINARIAS

donde Z
µ(x) = exp p(x) dx. (1.15)

En la sección anterior se demostró que si la ecuación (1.12) tiene una solución, entonces ésta
debe estar dada por la ecuación (1.14). Al observar con más cuidado esa deducción, también se
puede concluir que la ecuación diferencial (1.12) debe tener una solución.
En efecto, dado que por hipótesis suponemos que p(x) es continua para α < x < β, se
concluye que p(x) está definida en este intervalo y que es una función diferenciable distinta de
cero. Al multiplicar la ecuación (1.12) por µ(x) (que se supone una función derivable para que
exista (µ.y)0 y, por lo tanto, continua) se obtiene

(µ(x)y)0 = µ(x)g(x). (1.16)

En virtud de que µ(x) y g(x) son continuas en [α, β], la función µ(x)g(x) es integrable en ese
intervalo, y la ecuación (1.14) se deduce de la ecuación (1.16). Además, la integral de µ(x)g(x)
es diferenciable (pues es µ(x).y), de modo que y(x) dada por la ecuación (1.14), existe y es
diferenciable en todo el intervalo [α, β]. Al sustituir la expresión para y(x) dada por la ecuación
(1.14) en la ecuación (1.12) o en la ecuación (1.16), es fácil verificar que esta expresión satisface
la ecuación diferencial en todo el intervalo [α, β]. Por último, la condición inicial (1.13) determina
de manera única la constante de integración c, de modo que existe sólo una solución del problema
con valor inicial, con lo que se completa la demostración.

Observaciones:

El teorema 1.2.1 establece que el problema con valor inicial dado tiene una solución y
también que el problema tiene sólo una solución. En otras palabras, el teorema asegura la
existencia y la unicidad de la solución del problema con valor inicial (1.12), (1.13). Además
establece que la solución existe en toda la extensión de cualquier intervalo que contenga al
punto inicial x0 en el que los coeficientes p(x) y g(x) sean continuos. Es decir, la solución
puede ser discontinua o no existir sólo en los puntos en los que por lo menos una de las
funciones p(x) o g(x) sea discontinua. Por lo tanto, se obtiene cierta información cualitativa
acerca de la solución con solo identificar los puntos de discontinuidad de p(x) y g(x). A
menudo estos puntos se identifican a simple vista, sin necesidad de resolver el problema.
Por lo tanto, si los coeficientes p(x) y g(x) son continuos para todo x ∈ R, entonces la
solución también existe y es continua para todo x ∈ R.

El teorema también afirma que la solución y = y(x) es una función diferenciable, ya que
su derivada y 0 (x) = −p(x)y + g(x) es continua.

Viviana A. Dı́az - Departamento de Matemática, UNS 9


Capı́tulo 2

Nociones de topologı́a en Rn

Varias de las propiedades más profundas del análisis real, como la convergencia y la con-
tinuidad, dependen de ciertas nociones y resultados topológicos. Introduciremos los conceptos
topológicos básicos y derivaremos algunas de las más cruciales propiedades topológicas del espacio
euclideano Rn .
Estudiaremos los conjuntos abiertos, que generalizan los intervalos abiertos de R, ası́ como
los conjuntos cerrados, que generalizan los intervalos cerrados. El estudio de conjuntos abiertos
y cerrados constituye el principio de la topologı́a. La mayorı́a del material se basa únicamente en
las propiedades de la función distancia y, por lo tanto, tiene sentido en cualquier espacio general
donde se defina una función distancia.

2.1. Función distancia.


La función distancia euclideana d para Rn está dada por
" n #1/2 q
2
X
d(x, y) = (xi − yi ) = (x1 − y1 )2 + (x2 − y2 )2 + . . . + (xn − yn )2 .
i=1

En particular:

Si n = 1, la distancia entre dos puntos x, y ∈ R está dada por d(x, y) = |x − y|.


2
Si n = 2, la distancia entre dos puntos q (x1 , x2 ) e (y1 , y2 ) del plano R está dada por la
fórmula conocida d((x1 , x2 ), (y1 , y2 )) = (x1 − y1 )2 + (x2 − y2 )2 .

Las propiedades básicas de la distancia d son:

1. d(x, y) ≥ 0.
Es decir, la distancia entre dos puntos es no negativa.

2. d(x, y) = 0 si y solo si x = y.
En otras palabras, el único punto que está a distancia cero de otro es el mismo punto.

10
CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

3. d(x, y) = d(y, x).


Es decir, la distancia es simétrica (la distancia de un primer punto a otro segundo punto
es igual a la distancia del segundo punto al primero).
4. Vale la desigualdad triangular:
d(x, y) ≤ d(x, z) + d(z, y). (2.1)

En otras palabras, la distancia de un primer punto a un segundo punto es menor a la suma


de la distancia del primer punto a un tercer punto más la distancia del tercero al segundo
punto.
Un conjunto M con una función distancia d que satisfaga estas propiedades recibe el nombre
de espacio métrico.

2.2. Bolas.
Introducimos en primer lugar el concepto de bola (o entorno) de radio ε en un espacio métrico
cualquiera, aunque nosotros nos concentraremos en el estudio del caso del espacio métrico Rn .
Definición 2.2.1 Sea (M, d) un espacio métrico M con una función distancia d definida en él.
Para cada c ∈ M y δ > 0, el conjunto
B(c, δ) = Bδ (c) = {x ∈ M : d(x, c) < δ}
se denomina bola de centro c y radio δ. Otras denominaciones utilizadas son entorno,
vecindad o disco de radio δ y centro c.

2.3. Conjuntos acotados


Definición 2.3.1 Se dice que un conjunto es acotado si está contenido en alguna bola con
centro en el origen (para algún radio).

Acotado −1 < x < 2 en R2 . No acotado

Viviana A. Dı́az - Departamento de Matemática, UNS 11


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Ejemplos: En todo espacio métrico (M, d) se tiene que:

1. El conjunto vacı́o es acotado.

2. Un conjunto finito de elementos es acotado.

3. Cualquier bola es acotada.

Ejercicio: Probar las tres afirmaciones de los ejemplos.

2.4. Conjuntos abiertos


Definición 2.4.1 Un subconjunto A de un espacio métrico (M, d) es abierto si para cada
x ∈ A ⊂ M existe ε > 0 tal que B(x, ε) ⊂ A.

Ejercicio: Probar que esta definición es equivalente a la definición de conjunto abierto dada
en el curso de “Análisis Matemático II”.

Ejemplos:

1. El conjunto vacı́o ∅ y el conjunto total Rn son abiertos en el espacio métrico M = Rn .


Probarlo como ejercicio.

2. La bola de radio 1 y centro en el origen en R2 {x ∈ R2 : kxk ≤ 1} no es un conjunto abierto,


ya que si un punto está en el “borde” de la bola (es decir, un punto x tal que kxk = 1),
toda bola de radio ε > 0 contiene puntos que no están en el conjunto.

Viviana A. Dı́az - Departamento de Matemática, UNS 12


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Observaciones:

Es importante notar que el valor ε de la definición de conjunto abierto puede depender de


x. Por ejemplo, un rectángulo en R2 que no incluye el “borde” es abierto, pero las bolas
de radio ε son cada vez más pequeñas al aproximarnos al “borde”; sin embargo, siempre
existe un ε > 0 para todo x.

Para afirmar si un conjunto es abierto o no, es esencial especificar el espacio Rn (o, en


general, el espacio métrico) del que va a considerarse como subconjunto.
Por ejemplo, si consideramos al intervalo (0, 1) en R = R1 , éste intervalo es un conjunto
abierto pero, sin embargo, si vemos este intervalo dentro de R2 (como un subconjunto del
eje x), el intervalo ya no es abierto.
Por defecto, se entiende que el espacio es el mismo de sus variables pero, si no lo es, debe
indicarse el espacio Rn dentro del que está considerándose el conjunto.

Proposición 2.4.2 En un espacio métrico toda bola B(x, ε), cualquiera que sean el radio ε y el
centro x, es un conjunto abierto.

La idea principal de la demostración, que puede clarificar “intuitivamente” la proposición, se


muestra en la figura siguiente.

Veamos ahora formalmente la demostración.

Viviana A. Dı́az - Departamento de Matemática, UNS 13


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Demostración: Para probar que una bola cualquiera Bε (x) es un conjunto abierto, debemos
probar que para todo punto y de la bola Bε (x) existe un radio positivo δ tal que la bola con
centro en el punto y y ese radio δ está incluı́da en la bola original Bε (x).
Sea Bε (x) una bola de cualquier radio ε y con centro en cualquier punto x del espacio métrico
en cuestión. Sea y ∈ Bε (x) un punto cualquiera en esa bola. Como y ∈ Bε (x), por definición de
Bε (x), tenemos que d(x, y) < ε. Basta tomar un número positivo δ tal que 0 < δ < ε − d(x, y)
para obtener que Bδ (y) ⊂ Bε (x). Veamos esta inclusión, mostrando que todo punto z en Bδ (y)
es también un punto de Bε (x).
Consideremos z ∈ Bδ (y). Por la desigualdad triangular (2.1) vale que d(z, x) ≤ d(z, y) +
d(y, x). Por otro lado, como z ∈ Bδ (y), tenemos que d(z, y) < δ y, entonces, d(z, x) ≤ d(z, y) +
d(y, x) < δ+d(x, y) (recordemos también que d(x, y) = d(y, x)). Dado que elegimos δ < ε−d(x, y),
tenemos que δ +d(x, y) < ε y, por lo tanto, d(z, x) < δ +d(x, y) < ε, es decir, z ∈ Bε (x). Con esto
probamos que todo punto z ∈ Bδ (y) es tal que z ∈ Bε (x) o, equivalentemente, que todo punto en
Bδ (y) pertenece también a Bε (x). Es decir, probamos que Bδ (y) ⊂ Bε (x) y, consecuentemente,
la bola arbitraria Bε (x) es un conjunto abierto.

Ejercicio: Probar que S = {(x, y) ∈ R2 : 0 < x < 1} es un conjunto abierto.


Sin embargo, S = {(x, y) ∈ R2 : 0 < x ≤ 1} no es un conjunto abierto. En efecto, existen
puntos como el (1, 0) ∈ S tales que toda bola con centro en él (y cualquier radio positivo) contiene
puntos de la forma (x, 0) tales que x > 1, es decir, puntos fuera del conjunto S.

2.5. Interior de un conjunto


Definición 2.5.1 Sean M un espacio métrico y A ⊂ M. Un punto x ∈ A es un punto interior
de A si existe un conjunto abierto U tal que x ∈ U ⊂ A.

Ejercicio: Mostrar la equivalencia entre esta definición y la dada en “Análisis Matemático


II”.

Viviana A. Dı́az - Departamento de Matemática, UNS 14


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Definición 2.5.2 El interior de A es la colección de todos los puntos interiores de A y se


denota int(A). Este conjunto puede ser vacı́o.

Ejercicios:

1. El interior de un único punto en Rn es vacı́o.

2. Sea S = {(x, y) ∈ R2 : 0 < x ≤ 1}. Determinar int(S).

3. Demostrar que el interior de un conjunto es un conjunto abierto.

4. Probar que int(A) es el mayor subconjunto abierto de A.

2.6. Conjuntos cerrados

Recordemos la definición de complemento de un conjunto antes de abordar la definición de


conjunto cerrado.
El complemento de un conjunto C respecto del conjunto M , que se nota M −C, es el conjunto
definido por M − C = {x ∈ M : x ∈ / C}.

Definición 2.6.1 Un conjunto C en un espacio métrico M es cerrado si su complemento (res-


pecto de M ) es un conjunto abierto.

Observación: Veremos la equivalencia de esta definición con la definición vista en “Análisis


Matemático II” más adelante, cuando veamos la noción de punto de acumulación.

Ejemplos:

1. El espacio total Rn y el conjunto vacı́o ∅ son conjuntos cerrados.

2. Un punto en Rn es un conjunto cerrado.

3. Cualquier conjunto finito de puntos de Rn es cerrado.

4. El conjunto S = {(x, y) ∈ R2 : x2 + y 2 ≤ 1} es cerrado. Es decir, la bola con centro en el


origen y radio 1 junto con su “borde” es un conjunto cerrado.

Viviana A. Dı́az - Departamento de Matemática, UNS 15


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Para probar que S es un conjunto cerrado, debemos probar que su complemento R2 − S es


un conjunto abierto.
En efecto, cualquiera que √sea el punto (x, y) ∈ R2 − S podemos considerar la distancia
ε = d((x, y), (0, 0)) − 1 = x2 + y 2 − 1 y tenemos que la bola de radio ε está totalmente
contenida en R2 − S. Por lo tanto, R2 − S es un conjunto abierto y, ası́, probamos que S
es un conjunto cerrado.

Ejercicios:

1. Probar las afirmaciones 1. a 3. de los ejemplos anteriores.

2. Decir si el conjunto S = {(x, y) ∈ R2 : 0 < x ≤ 1, 0 ≤ y ≤ 1} es cerrado.

Observación: Existen conjuntos que no son abiertos ni cerrados. Por ejemplo, un intervalo
semiabierto (0, 1] no es abierto ni cerrado en R.
Por lo tanto, aunque sepamos que un conjunto no es abierto, no podemos concluir que sea
necesariamente cerrado.

2.7. Conjuntos compactos

Definición 2.7.1 Un conjunto A ⊆ Rn se dice compacto si A es un conjunto cerrado y acotado.

Ejercicios: Demostrar que:


1. El conjunto vacı́o es compacto.

2. Un conjunto finito de elementos de Rn es compacto.

3. La recta real R no es compacta (en ningún espacio Rn ).

4. El conjunto S = {(x, y) ∈ R2 : 0 ≤ x < 1, 0 ≤ y ≤ 1} no es compacto.

2.8. Puntos de acumulación


Definición 2.8.1 Un punto x en un espacio métrico M se dice un punto de acumulación de
un conjunto A ⊂ M si todo conjunto abierto U que contiene a x contiene también algún punto
de A, distinto de x.

Viviana A. Dı́az - Departamento de Matemática, UNS 16


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Nota: El punto de acumulación no tiene que pertenecer al conjunto del que es punto de
acumulación.

Ejercicios: Probar que


1. x es un punto de acumulación de A si y solo si para cada ε > 0, B(x, ε) contiene algún
punto y de A tal que y 6= x.

2. En R, un conjunto formado por un único punto no tiene puntos de acumulación.

3. Todos los puntos de [0, 1] son puntos de acumulación del intervalo abierto (0, 1).

Las definiciones de punto de acumulación y de conjunto cerrado tienen una estrecha relación,
como lo demuestra el siguiente teorema.

Teorema 2.8.2 Un conjunto A ⊂ M es cerrado si y solo si todos los puntos de acumulación de


A pertenecen a A.

Demostración:
⇒) Supongamos que A es cerrado y x es un punto de acumulación de A. Si x ∈ / A, el
n
complemento R − A es un conjunto abierto que contiene a x y que debe contener al menos un
punto de A porque x es punto de acumulación de A. Esto es un absurdo, pues el complemento
de A no contiene puntos de A. Luego el punto x de acumulación de A debe pertenecer a A.
⇐) Supongamos que un conjunto A contiene todos sus puntos de acumulación y probemos
que A es cerrado, mostrando que Rn − A es abierto.
Sea y ∈ Rn − A, entonces por nuestra hipótesis de que A contiene todos sus puntos de
acumulación, y no es un punto de acumulación de A. Ası́, existe un conjunto abierto V que
contiene a y y que no contiene puntos de A. Luego V está contenido en Rn − A, por lo que el
punto y es un punto interior de Rn − A y, como y es un punto arbitrario de Rn − A, tenemos que
todo punto de Rn − A es interior. Luego, Rn − A es abierto.
El teorema 2.8.2 puede ser intuitivamente claro pues la propiedad de ser cerrado significa,
a grandes rasgos, que un conjunto contiene todos los puntos de su “frontera”, y tales puntos

Viviana A. Dı́az - Departamento de Matemática, UNS 17


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

son puntos de acumulación. Este tipo de argumento es impreciso y tiene ciertas dificultades, por
ejemplo en casos donde la intuición de “frontera” no es clara, por lo que debemos tener cuidado
ya que algunos conjuntos son lo bastante complejos como para que falle nuestra intuición. Por
ejemplo, el conjunto A = {1/n ∈ R : n ∈ Z} ∪ {0} es cerrado y su único punto de acumulación,
que es {0}, pertenece a A (ver como ejercicio).

Nota: Observar que este teorema da la equivalencia entre la definición de conjunto cerrado
vista en este curso y la definición considerada en “Análisis Matemático II”.
Observación: Un conjunto no tiene por qué tener puntos de acumulación pero, en ese caso,
el teorema (2.8.2) se aplica trivialmente y de ese modo podemos concluir que un conjunto sin
puntos de acumulación es cerrado.
Ejercicios: Probar que los siguientes conjuntos no poseen puntos de acumulación, por lo
tanto, son cerrados.
1. Un conjunto de un único punto.
2. El conjunto de números enteros en R.
3. Determinar los puntos de acumulación de S = {(x, y) ∈ R2 : y < x2 + 1}. (Idea: observar
la figura siguiente)

2.9. Clausura de un conjunto


Vimos que el interior de un conjunto A es el mayor subconjunto abierto de A. De forma
similar, podemos construir el menor conjunto cerrado que contiene a un conjunto A, al que
llamamos clausura de A y denotamos cl(A) o, a veces, A.

Definición 2.9.1 Sean (M, d) un espacio métrico y A ⊂ M. La clausura de A, denotada cl(A),


es la intersección de todos los conjuntos cerrados que contienen a A.

Viviana A. Dı́az - Departamento de Matemática, UNS 18


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Por ejemplo, en R, cl((0, 1)) = [0, 1] (ver ejercicio 3. de la página 1).

Ejercicios: Probar que


1. La clausura de un conjunto es un conjunto cerrado.
2. La clausura de un conjunto contiene al conjunto.
3. Un conjunto es cerrado si y solo si coincide con su clausura.

Proposición 2.9.2 Si A ⊂ M, la clausura de A es el conjunto formado por A y sus puntos de


acumulación de A.
Demostración: Hacer como ejercicio.

Nota: Esta proposición da la equivalencia entre la definición de clausura de un conjunto


considerada en este curso y la definición dada en el curso de “Análisis Matemático II”.

A la vista de esta proposición, en otras palabras, podemos afirmar que para determinar la
clausura de un conjunto A, añadimos a A todos los puntos de acumulación que no se encuentren
ya en A.

Ejemplos/Ejercicios:
1. Para cualquier A ⊂ Rn , mostrar que Rn − cl(A) es abierto.
2. La clausura de un conjunto es igual a la clausura de su complemento.

2.10. Frontera de un conjunto

Si consideramos el disco unidad en R2 , sabemos lo que queremos denominar la frontera: la


elección obvia es la circunsferencia unidad. Para conjuntos más complejos, como los racionales,
no está claro qué deberı́a ser la frontera. Por lo tanto, necesitamos una definición precisa.
Definición 2.10.1 Para un conjunto dado A en un espacio métrico (M, d), la frontera de A,
que se nota ∂(A), se define como el conjunto ∂(A) = cl(A) ∩ cl(M − A). Es decir, la fronte-
ra de un conjunto está constituı́da por los puntos pertenecientes a la clausura del conjunto y,
simultáneamente, a la clausura de su complemento.

La frontera tiene también la siguiente descripción.

Viviana A. Dı́az - Departamento de Matemática, UNS 19


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Proposición 2.10.2 Sea A ⊂ M. Entonces x ∈ ∂A si y solo si para todo ε > 0, B(x, ε) contiene
puntos de A y de M − A.

Demostración: Hacer como ejercicio.


La definición original y la proposición anterior establecen que, intuitivamente, la frontera de
un conjunto ∂A es la “lı́nea divisoria” entre A y M − A.

Ejercicios:

1. Demostrar que la frontera de Rn y la frontera del conjunto vacı́o coinciden y el el conjunto


vacı́o, es decir, ∂Rn = ∂∅ = ∅.

2. Determinar la frontera del conjunto S = {(x, y) ∈ R2 : x2 − y 2 > 1}.

3. Probar que la frontera de un conjunto es el conjunto de puntos que no pertenecen al interior


del conjunto ni al interior de su complemento.
Nota: Esta prueba muestra que la definición de frontera vista en este curso es equivalente
a la definición vista en “Análisis Matemático II”.

2.11. Convexidad de un conjunto


Definición 2.11.1 Decimos que A ⊆ Rn es un conjunto convexo si, para todo x, y ∈ A, el
segmento de x a y está contenido enteramente en A.

Viviana A. Dı́az - Departamento de Matemática, UNS 20


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Convexo No convexo

Ejercicios: Probar que:

1. El conjunto vacı́o es convexo.

2. Todo conjunto de un único punto es convexo.

3. La recta real es un conjunto convexo.

4. Una bola es un conjunto convexo.

5. La intersección de dos conjuntos convexos es convexo.

2.12. Conexidad de un conjunto


Definición 2.12.1 Un subconjunto D de Rn se dice disconexo si existen dos conjuntos abiertos
A, B tales que A∩D y B∩D son conjuntos no vacı́os y disjuntos cuya unión es D. Un subconjunto
C de Rn que no es disconexo se dice conexo.

Conjunto conexo Conjunto disconexo

Ejemplo: El conjunto de los números naturales N es disconexo en R.


Podemos tomar A = {x ∈ R : x < 3/2} y B = {x ∈ R : x > 3/2}.

Es mucho más difı́cil mostrar que un conjunto es conexo que mostrar que es disconexo. Para
mostrar que un conjunto es disconexo se necesita encontrar solo un par de conjuntos A y B en
las condiciones de la definición, mientras que para mostrar que un conjunto es conexo se necesita
mostrar que no existe ningún par de estos conjuntos.

Teorema 2.12.2 El conjunto R es conexo.

Viviana A. Dı́az - Departamento de Matemática, UNS 21


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Demostración: Sean A y B conjuntos disjuntos y no vacı́os, tales que A ∪ B = R. Con-


sideremos a ∈ A, b ∈ B siendo a < b y c = inf {x : [x, b] ⊂ B}. Es claro que c existe, pues
inf {x : [x, b] ⊂ B} =
6 ∅ ya que contiene a b dado que [b, b] ⊂ B, y es acotado por debajo porque
[a, b] * B. Además, si c ∈ A, c no es interior, pues como A es abierto, existirı́a una bola de
centro c contenida en A y luego c no serı́a el ı́nfimo. Entonces A no es abierto porque tiene
puntos no interiores. Análogamente, si c ∈ B entonces B no es abierto. Esto prueba que R no
puede descomponerse en una unión disjunta de abiertos no vacı́os, es decir, que R es conexo.

2.13. Arco-conexidad de un conjunto

Definición 2.13.1 Si x e y son dos puntos en Rn , entonces una curva poligonal que une x e
y es un conjunto obtenido como unión de un número finito de segmentos ordenados (L1 , L2 , ...Ln )
en Rn tal que el segmento L1 tiene puntos extremos x y z1 ; el segmento L2 tiene extremos z1 y
z2 ; ...; y el segmento Ln tiene extremos zn−1 e y.

Teorema 2.13.2 Si G es un conjunto abierto conexo en Rn , entonces todo par de puntos x, y ∈ G


puede unirse por una curva poligonal totalmente contenida en G.

Dem:
Supongamos que G es un conjunto conexo abierto en Rn y que x ∈ G. Sea G1 el subconjunto
de G que consiste de todos los puntos de G que pueden ser unidos a x por una curva poligonal
que yace enteramente en G; sea G2 el conjunto de todos los puntos de G que no pueden ser
unidos a x por una curva poligonal en G. Es claro que G1 ∩ G2 = ∅ y G1 ∪ G2 = G. El conjunto
G1 es no vacı́o pues contiene al punto x. Mostraremos ahora que G1 es abierto en Rn .
Si y ∈ G1 , sigue del hecho de que G es abierto que para algún número real positivo r, se
tiene que |w − y| < r implica que w ∈ G. Por definición de G1 , el punto y puede ser unido a
x por una curva poligonal y agregando un segmento de y a w (que existe porque una bola es
convexa, ver ejercicio anterior), inferimos que w ∈ G1 . Luego G1 es un subconjunto abierto de
Rn . Similarmente, el subconjunto G2 es abierto en Rn .
Si G2 = ∅, no hay nada que probar.
Si G2 es no vacı́o, entonces los conjuntos G1 , G2 desconectan G, contradiciendo la hipótesis
de que G es conexo.
Luego, G2 = ∅ y todo punto de G puede ser unido a x por una curva poligonal enteramente
contenida en G.
Observación: También vale, para todo conjunto no necesariamente abierto, la recı́proca del
teorema 2.13.2, es decir, si todo par de puntos de un conjunto puede unirse por una poligonal
totalmente contenida en el conjunto, el conjunto es conexo. No veremos la prueba por el momento.

Viviana A. Dı́az - Departamento de Matemática, UNS 22


CAPÍTULO 2. NOCIONES DE TOPOLOGÍA EN RN

Nota: El hecho de que todo par de puntos de un conjunto puede unirse por una poligonal
totalmente contenida en el conjunto es la definición de conjunto arco-conexo considerada en el
curso de “Análisis Matemático II”.
Equivalentemente, puede definirse la noción de conjunto arco-conexo como sigue.

Definición 2.13.3 Un arco continuo que une dos puntos x, y en un espacio métrico M es
una aplicación ϕ : [a, b] → M continua tal que ϕ(a) = x y ϕ(b) = y. Decimos que un arco ϕ
está contenido en un conjunto A si ϕ(t) ∈ A para todo t ∈ [a, b].

Definición 2.13.4 Decimos que un conjunto es arco-conexo (o conexo por arcos) si todo
par de puntos del conjunto se pueden unir mediante un arco continuo contenido en el conjunto.

Ejemplo: El intervalo [0, 1] es conexo por arcos.


En efecto, si x e y son dos puntos en el intervalo [0, 1] definimos ϕ : [0, 1] → R como
ϕ(t) = (y − x)t + x. Este es un arco continuo que une x e y y que está contenido en [0, 1].

Viviana A. Dı́az - Departamento de Matemática, UNS 23


Capı́tulo 3

Diferenciabilidad de funciones de varias


variables

¿Cómo podemos recuperar en varias variables la idea de derivabilidad de una función de una
variable real f : R → R como una propiedad de suavidad de una función, en particular, de
continuidad?
Lo que haremos será recurrir a la idea de aproximación lineal que en una variable está dada
por la recta tangente.

3.1. Transformaciones diferenciables

En esta sección definimos el concepto de diferenciabilidad y de derivada de una función de


varias variables en un punto. Debido al hecho de que una función en Rn no depende solo de una
variable real y, además, sus valores son vectores, no podemos definir la derivada en Rn de la
manera en que lo hicimos al tratar funciones de una variable. Sin embargo, sı́ motivaremos la
definición de la derivada a partir de funciones reales de una sola variable.
Recordemos que una función de una variable f : (a, b) → R es derivable (o diferenciable) en
x0 ∈ (a, b), si existe el lı́mite

f (x0 + h) − f (x0 )
lı́m = f 0 (x0 ).
h→0 h
De forma equivalente, podemos escribir esta fórmula como las siguientes igualdades:

f (x0 + h) − f (x0 ) − f 0 (x0 )h


lı́m = 0,
h→0 h

f (x) − f (x0 ) − f 0 (x0 )(x − x0 )


lı́m =0 o
x→x 0 x − x0

f (x) − f (x ) − f 0 (x )(x − x ) |f (x) − f (x0 ) − f 0 (x0 )(x − x0 )|



0 0 0
lı́m = lı́m = 0.

x − x0 |x − x0 |

x→x0 x→x0

24
CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

El número f 0 (x0 ) representa la pendiente de la recta tangente a la gráfica de f en el punto


(x0 , f (x0 )).
La derivabilidad (o diferenciabilidad) de f : R → R en x0 es equivalente a la existencia de un
número m (la pendiente de la recta tangente) tal que

|f (x) − f (x0 ) − m(x − x0 )|


lı́m = 0.
x→x0 |x − x0 |

Observemos que la función T (s) = ms es lineal: En efecto, T (αs + βt) = m(αs + βt) =
α(ms) + β(mt) = αT (s) + βT (t) para todo α, β, s y t reales.
Es decir, que la función x − x0 7→ m(x − x0 ) es una función lineal en x − x0 que sumada a
f (x0 ) aproxima a la función f (x) “cerca” de x0 .
Para generalizar este concepto al caso de las transformaciones f : A ⊂ Rn → Rm , damos la
siguiente definición.

Definición 3.1.1 Una función f : A ⊂ Rn → Rm es diferenciable en x0 ∈ A si existe una


transformación lineal, denotada Df (x0 ) : Rn → Rm y llamada diferencial de f en x0 tal que

k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k


lı́m = 0.
x→x0 k x − x0 k

Si f es diferenciable en cada punto de A, decimos que f es diferenciable en A.

En esta definición, Df (x0 )(x−x0 ) denota el valor de la transformación lineal Df (x0 ) aplicada
al vector x − x0 ∈ Rn , de modo que Df (x0 )(x − x0 ) ∈ Rm . Con frecuencia escribiremos Df (x0 ).h
en vez de Df (x0 )(h).
Podemos reescribir la definición diciendo que para cada ε > 0 existe δ > 0 tal que x ∈ A y
k x − x0 k< δ implican

k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k ≤ ε k x − x0 k .

En la definición 3.1.1 está implı́cito que x 6= x0 , pero en esta última formulación, podemos
permitir que x = x0 , pues ambos miembros se reducen a cero.
Intuitivamente, se supone que x 7→ f (x0 ) + Df (x0 )(x − x0 ) es la mejor aproximación “afı́n”
a f cerca del punto x0 .
Nota: Afı́n significa lineal (el nulo va al nulo) más una constante o translación a otro punto no
nulo, en forma análoga a la recta tangente que es lineal en una variable pero que, eventualmente,
no pasa por cero sino por el punto de la curva donde es tangente.

f : R → R, ecuación de la recta tangente:


y = f (x0 ) + f 0 (x0 )(x − x0 )
y = f (x0 ) + Df (x0 )(x − x0 )

Viviana A. Dı́az - Departamento de Matemática, UNS 25


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

f : R2 → R, ecuación del plano tangente:


z = f ((x0 , y0 )) + Df (x0 , y0 )((x, y) − (x0 , y0 ))
z = f (x0 ) + Df (x0 )(x − x0 )

Intuitivamente, esperamos que haya solo una mejor aproximación lineal de una función en
un punto. El siguiente teorema prueba que esa intuición es correcta si suponemos que A es un
conjunto abierto.

Teorema 3.1.2 Sea A un conjunto abierto en Rn y supongamos que f : A → Rm es diferen-


ciable en x0 . Entonces Df (x0 ) queda determinada de forma única por f.

Demostración: Supongamos que L1 y L2 son dos transformaciones lineales que satisfacen


las condiciones de la definición de función diferenciable en el punto x0 ∈ A = Dom(f ). Esto es,

k f (x) − f (x0 ) − L1 (x − x0 ) k k f (x) − f (x0 ) − L2 (x − x0 ) k


lı́m =0 y lı́m = 0.
x→x0 k x − x0 k x→x 0 k x − x0 k

Debemos mostrar que L1 = L2 .


Sea e ∈ Rn un vector cualquiera tal que k e k= 1 y consideremos x = x0 + λe, con λ ∈ R.
Tenemos que x ∈ A para λ suficientemente pequeño, ya que A es un conjunto abierto y x0 ∈ A.
Entonces, como λ.e = x − x0 , k λe k= |λ| =k x − x0 k y

|λ| k L1 .λ.e − L2 .λ.e k k L1 (x − x0 ) − L2 (x − x0 ) k


k L1 .e − L2 .e k= . k L1 .e − L2 .e k= = =
|λ| |λ| k x − x0 k

k −f (x) + f (x0 ) + L1 (x − x0 ) + f (x) − f (x0 ) − L2 (x − x0 ) k


= ≤
k x − x0 k
k f (x) − f (x0 ) − L1 (x − x0 ) k k f (x) − f (x0 ) − L2 (x − x0 ) k
≤ + ,
k x − x0 k k x − x0 k
por la desigualdad triangular.
Cuando x → x0 , por la hipótesis de que las transformaciónes L1 y L2 satisfacen la condición
de diferenciabilidad de f , estos dos últimos sumandos tienden a 0. Por lo tanto,

lı́m k L1 .e − L2 .e k= 0
x→x0

y se tiene que L1 .e = L2 .e.


Nuestra selección del versor e fue arbitraria, excepto por la condición de ser un vector tal que
y
k e k= 1, pero para cualquier vector no nulo y ∈ Rn , puede tomarse e = de longitud 1 y,
kyk
por linealidad, si L1 (e) = L2 (e), entonces L1 (y) = L2 (y). 

Viviana A. Dı́az - Departamento de Matemática, UNS 26


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Nota: En general, Df no está determinada de forma única.


Por ejemplo, si A = {x0 } es un conjunto formado por un único punto (no es abierto), cualquier
Df (x0 ) satisface la condición de derivabilidad para cualquier f . En efecto, si x ∈ A y es tal que
k x−x0 k< δ, se cumple solo si x = x0 , en cuyo caso la expresión k f (x)−f (x0 )−Df (x0 )(x−x0 ) k
se anula. La definición se cumple entonces de manera trivial.

Ejemplos:
dx3
1. Sea f : R → R tal que f (x) = x3 . Entonces f 0 (x) = = 3x2 . Luego, Df (x) es la
dx
transformación lineal h 7→ Df (x).h = 3x2 h.

2. Sea f : R2 → R dada por f (x, y) = sen(x). Demostraremos que f es diferenciable en cada


(x0 , y0 ) ∈ R2 y la función lineal Df (x0 , y0 ), su diferencial en (x0 , y0 ), está dada por

Df (x0 , y0 )(x, y) = x cos(x0 ), para cada (x, y) ∈ R2 .


Sea (h, k) ∈ R2 , con (h, k) 6= (0, 0). Entonces,

k f ((x0 , y0 ) + (h, k)) − f (x0 , y0 ) − Df (x0 , y0 )(h, k) k k sen(x0 + h) − sen(x0 ) − h cos(x0 ) k


=
k (h, k) k k (h, k) k

k sen(x0 + h) − sen(x0 ) − h cos(x0 ) k


≤ , (3.1)
khk
donde la última inecuación vale por la desigualdad triangular.
sen(x0 + h) − sen(x0 )
Si (h, k) → (0, 0), tenemos que lı́m = cos(x0 ). Por lo tanto, la
h→0 h
suma (3.1) tiende a cero y, consecuentemente,
k f ((x0 , y0 ) + (h, k)) − f (x0 , y0 ) − Df (x0 , y0 )(h, k) k
lı́m = 0.
x→x0 k (h, k) k
Ası́, f (x, y) resulta diferenciable y su diferencial es Df (x0 , y0 )(x, y) = x cos(x0 ).
Como toda transformación lineal, Df (x0 ) se puede representar como ! multiplicación por
  x
una matriz. De hecho, Df (x0 )(x, y) = x cos(x0 ) = cos(x0 ) 0 , por lo que podemos
y
 
afirmar que Df (x0 ) induce la matriz fila, de orden 1 × 2, dada por cos(x0 ) 0 . Es decir,
 
que podemos escribir Df (x0 ) = cos(x0 ) 0 .

Ejercicios:
1. Probar que si f : Rn → Rm es constante, entonces Df (x0 ) = 0 para cada x0 ∈ Rn .

2. Si L : Rn → Rm es lineal, entonces DL(x) = L para cada x0 ∈ Rn .

3. Si sum : R2 → R está dada por sum(x, y) = x + y, entonces Dsum(x0 , y0 ) = sum para


cada (x0 , y0 ) ∈ R2 .

4. Si mult : R2 → R está dada por mult(x, y) = xy, entonces Dmult(x0 , y0 )(x, y) = y0 x + x0 y


para cada (x0 , y0 ) ∈ R2 .

Viviana A. Dı́az - Departamento de Matemática, UNS 27


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

3.2. Derivadas parciales

Además de la definición del diferencial Df (x) mediante un lı́mite, hay otra forma de derivar
“parcialmente” una función f de varias variables.
Dada f : Rn → Rm , escribimos la imagen de f en componentes

f (x1 , ..., xn ) = (f1 (x1 , ..., xn ), ..., fm (x1 , ..., xn )).

Entonces tiene sentido considerar la derivada usual (en una variable) de cada componente fj
con respecto a la variable xi mientras mantenemos las demás variables x1 , ..., xi−1 , xi+1 , ..., xn
fijas (como si xi fuera la única variable de la función fj ). Esta derivada se llama “parcial” pues
se deriva solamente respecto de la variable xi que no es la única variable de la función fj . Su
definición formal es la que sigue.

Definición 3.2.1 Definimos la derivada parcial de la componente fj respecto de la variable


∂fj
xi y la notamos , como el siguiente lı́mite, si éste existe:
∂xi

∂fj fj (x1 , ..., xi + h, ..., xn ) − fj (x1 , ..., xn )


(x1 , ..., xn ) = lı́m
∂xi h→0 h

para j = 1, ..., m e i = 1, ..., n.

3.3. Representación matricial

Vimos que Df (x) para f : R → R es simplemente la transformación lineal “multiplicación


∂f
por ”. Podemos generalizar este hecho en el siguiente teorema.
∂x

Teorema 3.3.1 Supongamos que A ⊂ Rn es un conjunto abierto y que f : A → Rm es diferen-


∂fj
ciable en A. Entonces las derivadas parciales existen y la matriz de la transformación lineal
∂xi
Df (x) con respecto a las bases canónicas de Rn y Rm está dada por

∂f1 ∂f1 ∂f1 
 ∂x ...
 1 ∂x2 ∂xn 

 
 
 ∂f2 ∂f2 ∂f2 

...

 
 ∂x ∂x2 ∂xn 
1



 (3.2)
 
 . .. .. .. 
 .. . . . 
 
 
 
 
 ∂fm ∂fm ∂fm 
...
∂x1 ∂x2 ∂xn

Viviana A. Dı́az - Departamento de Matemática, UNS 28


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Demostración:
Por definición de la matriz de una transformación lineal en las bases canónicas, el elemento
(j, i) de la matriz de Df (x) es la j-ésima componente del vector Df (x).ei , es decir, de la trans-
formación Df (x) aplicada al i-ésimo vector ei de la base canónica. Notamos esta componente
aji .
Sea y = x + hei , para h ∈ R, y observemos que

k f (y) − f (x) − Df (x).(y − x) k k f (x1 , ..., xi + h, ..., xn ) − f (x1 , ..., xn ) − hDf (x).ei k
=
ky−xk khk

tiende a cero cuando h → 0, por ser Df (x) el diferencial de f . Si todo el cociente (que es un
módulo en el espacio euclideano Rn ) tiende a cero, podemos afirmar que cada componente tiende
a cero, en particular, también lo hace la j-ésima componente del cociente. Es decir,

| fj (x1 , ..., xi + h, ..., xn ) − fj (x1 , ..., xn ) − h.aji |


lı́m = 0.
h→0 |h|

Por lo tanto,
fj (x1 , ..., xi + h, ..., xn ) − fj (x1 , ..., xn ) h.aji
lı́m = lı́m = aji .
h→0 h h→0 h
Ası́, hemos probado que

fj (x1 , ..., xi + h, ..., xn ) − fj (x1 , ..., xn ) ∂fj


aji = lı́m = ,
h→0 h ∂xi
por definición de derivada parcial. 

Definición 3.3.2 La matriz (3.2) del teorema 3.3.1 se llama la matriz jacobiana o matriz
derivada de f .

Nota: Debemos enfatizar que Df es una transformación lineal en cada x ∈ A y la definición


de Df es independiente de la base utilizada.
Recordemos de geometrı́a analı́tica que si cambiamos de la base canónica a otra base, los
elementos de la matriz también se modifican. Si examinamos la definición de la matriz de una
transformación lineal, se puede ver que las columnas de la matriz con respecto a la nueva base
serán la diferencial Df aplicada a la nueva base de Rn , donde el vector imagen se expresa en la
nueva base de Rm . Por supuesto, la propia transformación lineal Df no cambia de base a base.

Al hacer cálculos especı́ficos, en general podemos calcular fácilmente la matriz jacobiana


de una función f y el teorema anterior nos da el diferencial Df (x) a partir de esa matriz.
La transformación lineal Df (x) es la determinada por la multiplicación de la matriz de esa
transformación en las bases canónicas, es decir, de la matriz jacobiana, por las componentes de
cada vector en la base canónica.
Si f : R → R es una función de una variable, la aplicación de la transformación lineal Df (x)
al vector h = x − x0 es Df (x)(h) = f 0 (x).h, es decir, es el producto de los números f 0 (x0 ) y
h ∈ R.

Viviana A. Dı́az - Departamento de Matemática, UNS 29


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Si f : Rn → R, es decir si m = 1, en la notación del teorema 3.3.1, Df (x) en las bases


canónicas está representada por la matriz fila, de orden 1 × n,
!
∂f ∂f
···
∂x1 ∂xn

y la diferencial de f aplicada a un vector a = (a1 , ..., an ) es


n
X ∂f
Df . a = ai . (3.3)
i=1 ∂xi

Definición 3.3.3 Si f : Rn → R, el vector de Rn cuyas componentes son iguales a los elementos


de la matriz jacobiana de f que representa al diferencial Df , se denomina gradiente de f y se
denota grad(f ) o ∇f. Simbólicamente, para cada f : A ⊂ Rn → R, se define
!
∂f ∂f
grad(f ) = ∇f = , ..., .
∂x1 ∂xn

Nota: El gradiente de una función f : Rn → R, es el vector de Rn tal que para cualquier


v ∈ Rn , vale que
h∇f (x), vi = Df (x).v.

(x sen(y))
Ejemplo: Sea f (x, y, z) = . Calcular grad(f ).
z
!
∂f ∂f ∂f
grad(f ) = , , .
∂x ∂y ∂z
∂f sen(y) ∂f x cos(y) ∂f x sen(y)
En este caso, tenemos = , = , =− .
∂x z ∂y z! ∂z z2
sen(y) x cos(y) x sen(y)
Luego, ∇f (x, y, z) = , ,− .
z z z2
Ejercicio: Sea f : R2 → R3 dada por f (x, y) = (x2 , x3 y, x4 y 2 ). Calcular Df.

3.4. Condiciones para la diferenciabilidad

Como la matriz jacobiana proporciona una herramienta de cálculo eficaz del diferencial de
una función en el caso en que la función sea diferenciable (ver teorema 3.3.1), serı́a útil saber si
la existencia de las derivadas parciales implica que la diferencial Df existe. Esto, por desgracia,
no es cierto en general. Por ejemplo, sea f : R2 → R dada por


 x, si y = 0
f (x, y) = y, si x = 0


1, en otro caso

Entonces ∂f /∂x y ∂f /∂y existen en (0, 0) y son iguales a 1. Sin embargo, f no es continua
en (0, 0) (¿por qué? Ejercicio).

Viviana A. Dı́az - Departamento de Matemática, UNS 30


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Dado que la idea es generalizar el caso de una variable y conservar la propiedad de continuidad
para una función diferenciable, si una función de varias variables no es continua en un punto, no
deberı́a ser diferenciable en ese punto.
Es bastante sencillo comprender por qué no es suficiente que las derivadas parciales existan
para que se tenga la diferenciabilidad de una función de varias variables. Las derivadas parciales
solo dependen de lo que ocurre en la dirección de los ejes X e Y , mientras que la definición de
la diferencial Df implica el comportamiento combinado de f en todo un entorno de un punto
dado, en todas las direcciones posibles en ese entorno. Si embargo, podemos afirmar lo siguiente.

Teorema 3.4.1 Sean A ⊂ Rn un conjunto abierto y f : A ⊂ Rn → Rm . Supongamos que


f = (f1 , ..., fm ). Si cada derivada parcial ∂fj /∂xi existe y es continua en A, entonces f es
diferenciable en A.

Demostración: Si Df (x) existe, por el teorema 3.3.1, su representación matricial en las


bases canónicas debe ser la matriz jacobiana.
Necesitamos mostrar que para x ∈ A fijo, dado ε > 0 existe δ > 0 tal que k y − x k< δ, con
y ∈ A, implica que
k f (y) − f (x) − Df (x)(y − x) k< ε k y − x k .
Para ello, basta demostrarlo para cada componente de f por separado (¿por qué? Ejercicio).
Por lo tanto, podemos suponer que m = 1. Escribimos

f (y) − f (x) = f (y1 , y2 , ..., yn ) − f (x1 , y2 , ..., yn ) + f (x1 , y2 , ..., yn ) − f (x1 , x2 , y3 , ..., yn )

+f (x1 , x2 , y3 , ..., yn ) − f (x1 , x2 , x3 , y4 , ..., yn ) + . . . − f (x1 , ..., xn−1 , yn )


+f (x1 , ..., xn−1 , yn ) − f (x1 , ..., xn ).
Ahora utilizamos el teorema del valor medio en una variable, que implica
∂f
f (y1 , ..., yn ) − f (x1 , y2 , ..., yn ) = (u1 , y2 , ..., yn )(y1 − x1 )
∂x1
para algún u1 entre x1 e y1 (y2 , ..., yn están fijos). Escribimos expresiones similares para los demás
términos y obtenemos

! !
∂f ∂f
f (y) − f (x) = (u1 , y2 , ..., yn ) (y1 − x1 ) + (x1 , u2 , y3 , ..., yn ) (y2 − x2 ) + . . . +
∂x1 ∂x2
!
∂f
(x1 , x2 , ..., xn−1 , un ) (yn − xn ).
∂xn
Como f : Rn → R, por la hipótesis de que podemos pensar en solo una componente, tenemos
la fórmula (3.3) que nos permite escribir
n
X ∂f
Df (x)(y − x) = (x1 , ..., xn )(yi − xi ), entonces
i=1 ∂x1
!
∂f ∂f
|f (y) − f (x) − Df (x)(y − x)| = (u1 , y2 , ..., yn ) − (x1 , ..., xn ) (y1 − x1 )


∂x1 ∂x1
!
∂f ∂f
+ (x1 , u2 , y3 , ..., yn ) − (x1 , ..., xn ) (y2 − x2 ) + . . .
∂x2 ∂x2

Viviana A. Dı́az - Departamento de Matemática, UNS 31


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

!
∂f ∂f
+ (x1 , x2 , ..., xn−1 , un ) − (x1 , ..., xn ) (yn − xn )
∂xn ∂xn
(
∂f ∂f

(u , y , ..., yn ) − (x1 , ..., xn ) + . . . +
∂x1 1 2

∂x1
)
∂f ∂f
(x , ..., xn−1 , un ) − (x1 , ..., xn ) .ky−xk

∂xn 1

∂xn

usando la desigualdad triangular y el hecho de que |yi − xi | ≤k y − x k .


∂f
Como las derivadas parciales son continuas por hipótesis y ui está entre yi y xi , existe
∂xi
δ > 0 tal que el término entre llaves es menor que ε para k y − x k< δ. Por lo tanto,

k f (y) − f (x) − Df (x)(y − x) k≤  k y − x k . 

3.4.1. Continuidad

A continuación enunciaremos formalmente la definición de continuidad de una función de


varias variables que es idéntica al caso conocido en una variable. Necesitamos que tomar el lı́mite
de la función en un punto coincida con evaluar la función en el punto.

Definición 3.4.2 Sea f : A ⊂ Rn → Rm . Decimos que f es continua en x0 ∈ A si, para todo


ε > 0, existe δ > 0 tal que, si k x − x0 k< δ, entonces

k f (x) − f (x0 ) k< ε.

Proposición 3.4.3 (Diferenciabilidad en abierto implica continuidad) Supongamos que


A ⊂ Rn es abierto y que f : A → Rm es diferenciable en A. Entonces f es continua.
De hecho, para cada x0 ∈ A existe una constante M > 0 y un δ0 > 0 tales que k x − x0 k< δ0
implica
k f (x) − f (x0 ) k≤ M k x − x0 k .
Esta condición recibe el nombre de Propiedad local de Lipschitz.

Demostración: Para demostrar la continuidad, basta demostrar la propiedad de Lipschitz,


pues dado ε > 0, podemos elegir δ = min(δ0 , ε/M ) para satisfacer la condición de la definición
de continuidad.
Vamos a demostrar la propiedad de Lipschitz. Sea ε = 1 en la definición de diferencial.
Entonces existe δ0 tal que k x − x0 k< δ0 implica

k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k≤k x − x0 k,

lo que implica a su vez que

k f (x) − f (x0 ) k≤k Df (x0 )(x − x0 ) k + k x − x0 k . (3.4)

Como L = Df (x0 ) una transformación lineal, vale que k Df (x0 )(x − x0 ) k≤ M0 k x − x0 k.

Viviana A. Dı́az - Departamento de Matemática, UNS 32


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

En efecto, si m = max{||L(e1 )||, . . . , ||L(en )||} siendo {e1 , . . . , en } la base canónica de Rn y


x = (x1 , . . . , xn ), entonces
||L(x)|| = ||L(x1 e1 + . . . + xn en )|| = ||x1 L(e1 ) + . . . + xn L(en )|| ≤ |x1 |.||L(e1 )|| + . . . + |xn |.||L(en )||
≤ m(|x1 | + . . . + |xn |) ≤ m.n||x|| := M0 ||x||.

Ası́, volviendo a nuestra desigualdad (3.4), basta tomar M = M0 +1 para obtener el resultado
de la proposición. 
Dijimos al comienzo del estudio del tema diferenciabilidad de una función que tenı́amos
intención de recuperar la idea de que una función diferenciable es una función suave, en particular
continua. Con la última proposición de la clase anterior lo hemos conseguido, hemos visto que la
diferenciabilidad de una función es garantı́a de su continuidad.
También adelantamos que para la idea geométrica de una función diferenciable recurrirı́amos
a la idea de aproximación lineal (o afı́n). En este sentido, supongamos que tenemos una función
f : Rn → R para la que existen todas sus derivadas parciales y nos preguntamos si estas
derivadas forman un “hiperplano” en Rn+1 , y si este “plano” aproxima a la función. En lo que
sigue estudiaremos estas ideas.

3.5. Derivadas direccionales

Las derivadas parciales de una función f : Rn → Rm definidas como


i
∂fj fj (x + hei ) − fj (x)
(x) = lı́m siendo ei = (0, . . . , 1̂, . . . , 0), miden su variación en las di-
∂xi h→0 h
recciones paralelas a los ejes (en dirección de los vectores ei ). En general, la existencia de una
derivada parcial nos dice que en la dirección del eje correspondiente a la variable respecto de la
que se deriva el gráfico es suave, es decir, existe recta tangente a la “superficie” en esa dirección.
Las derivadas direccionales hacen lo mismo que las derivadas parciales pero en todas direc-
ciones.
Definición 3.5.1 Sea f una función escalar definida en un entorno de x0 ∈ Rn y sea e ∈ Rn
un vector unitario cualquiera. Entonces
d f (x0 + te) − f (x0 )
f (x0 + te)|t=0 = lı́m
dt t→0 t
es la derivada direccional de f en x0 en la dirección de e.
La derivada direccional es la variación de f en la dirección e y, si f : R2 → R, da la pendiente
de la gráfica de f en esa dirección.

Viviana A. Dı́az - Departamento de Matemática, UNS 33


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Pueden visualizarse las derivadas direccionales de una función f : R2 → R en el siguiente


sitio de GeoGebra: https://www.geogebra.org/m/Bx8nFMNc.

Proposición 3.5.2 Si f : Rn → Rm es una función diferenciable, la derivada direccional en la


dirección de e es igual a Df (x0 ).e.

Demostración: Por la definición de Df (x0 ) con x = x0 + te, sabemos que



f (x) − f (x ) − Df (x ).(x − x ) f (x + te) − f (x0 ) − Df (x0 ).te
0 0 0 0
0= lı́m = lı́m .

x − x0

x→x0 t→0 te

Entonces dado ε > 0, existe t suficientemente pequeño tal que



f (x
0 + te) − f (x0 )
− Df (x0 ).e ≤ ε||e|| = ε.


t
Ası́, si f es diferenciable en x0 , entonces las derivadas direccionales también existen y están dadas
por
f (x0 + te) − f (x0 )
lı́m = Df (x0 ).e. 
t→0 t
∂f
Observación: En particular, notemos que la derivada parcial es la derivada de f =
∂xi
(f1 , . . . , fm ) en la dirección del i-ésimo eje de coordenadas, es decir, con
i
e = ei = (0, 0, ..., 0, 1, 0, ..., 0). En efecto,
!
∂f1 ∂f2 ∂fm ∂ ∂f
Df (x0 ).ei = , ,..., = (f1 , f2 , . . . , fm ) = .
∂xi ∂xi ∂xi ∂xi ∂xi

Pueden verse las derivadas parciales de una función f : R2 → R en el siguiente sitio de


GeoGebra: https://www.geogebra.org/m/K3xnQRY8

Para una función f : R2 → R, las derivadas direccionales Df (x0 ).e se pueden usar para
determinar el plano tangente a la gráfica de f . Es decir, la recta L(x) dada por z = f (x0 ) +
Df (x0 ).te es tangente a la gráfica de f pues Df (x0 ).e es la variación de f en la dirección de e.
Ası́, el plano tangente a la gráfica de f en (x0 , f (x0 )) se puede definir mediante la ecuación

z = f (x0 ) + Df (x0 ).(x − x0 ).

Viviana A. Dı́az - Departamento de Matemática, UNS 34


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Podemos visualizar el plano tangente a una superficie en un punto en el recurso de GeoGebra


del link: https://www.geogebra.org/m/wTh7KKd3

Proposición 3.5.3 Sea f : A ⊂ R2 → R una función diferenciable en (a1 , a2 ) ∈ A y sea


∂f ∂f
z = ϕ(x, y) = f (a1 , a2 ) + (a1 , a2 )(x − a1 ) + (a1 , a2 )(y − a2 ) el plano tangente a la superficie
∂x ∂y
definida por f en el punto (a1 , a2 , f (a1 , a2 )). Entonces, el plano tangente es el que mejor aproxima
a la superficie de todos los planos de R3 que pasan por (a1 , a2 , f (a1 , a2 )).

Demostración: Hacer como ejercicio.


∂f ∂f
(a1 , a2 )(x − a1 ) +
En otras palabras, z = f (a1 , a2 ) + (a1 , a2 )(y − a2 ) es la función afı́n
∂x ∂y
que mejor aproxima a f en un entorno de (a1 , a2 ).
Todo lo relativo al plano tangente a una superficie z = f (x, y) en R3 se puede generalizar
sin dificultad para el caso de una función xn+1 = f (x1 , . . . , xn ) donde (x1 , . . . , xn ) ∈ A ⊂ Rn
∂fj
diferenciable en un punto x0 ∈ A. Como sabemos, basta para ello que las derivadas parciales
∂xi
sean funciones continuas en un entorno de x0 .

Definición 3.5.4 La función afı́n

xn+1 = f (x0 ) + Df (x0 )(x − x0 ) = ϕ(x1 , . . . , xn )

tiene como gráfico {(x1 , . . . , xn+1 ) : xn+1 = ϕ(x1 , . . . , xn )} y se define como la variedad lineal
tangente a la “superficie” xn+1 = f (x1 , . . . , xn ) en el punto {(x0 , f (x0 ))} de la misma.

3.6. La regla de la cadena


Como vimos en el caso de funciones de una variable, una de las técnicas de derivación más
importantes es la regla de la cadena o regla de la composición. Para funciones de varias variables,
existe un proceso análogo al realizado en el caso de una variable que se enuncia en el siguiente
teorema.

Teorema 3.6.1 Regla de la cadena. Sean A ⊂ Rn abierto y f : A → Rm diferenciable en


x0 ∈ A. Sean B ⊂ Rm abierto, f (A) ⊂ B y g : B → Rp diferenciable en f (x0 ). Entonces la
composición g ◦ f : A ⊂ Rn → Rp es diferenciable en x0 y

D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 )

Observemos que el miembro derecho de la última igualdad está bien definido, pues
Df (x0 ) : Rn → Rm y Dg(f (x0 )) : Rm → Rp y, por lo tanto, su composición como transfor-
maciones lineales está definida. La regla de la cadena nos dice cómo derivar una composición de
funciones.

Demostración: Para demostrar D(g ◦ f )(x0 ).y = Dg(f (x0 )).(Df (x0 ).y), mostraremos que

k (g ◦ f )(x) − (g ◦ f )(x0 ) − Dg(f (x0 )).(Df (x0 )(x − x0 )) k


lı́m = 0.
x→x 0 k x − x0 k

Viviana A. Dı́az - Departamento de Matemática, UNS 35


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

Para ello acotamos el numerador como sigue:

k (g◦f )(x)−(g◦f )(x0 )−Dg(f (x0 )).Df (x0 )(x−x0 ) k=k g(f (x))−g(f (x0 ))−Dg(f (x0 ))(f (x)−f (x0 ))+

Dg(f (x0 ))[f (x) − f (x0 ) − Df (x0 )(x − x0 )] k


≤k g(f (x))−g(f (x0 ))−Dg(f (x0 ))(f (x)−f (x0 )) k + k Dg(f (x0 ))(f (x)−f (x0 )−Df (x0 )(x−x0 )) k
por la desigualdad triangular.
Como f es diferenciable, existen δ0 y M > 0 tales que kf (x) − f (x0 )k ≤ M kx − x0 k siempre
que k x − x0 k< δ0 , por la propiedad local de Lipschitz (ver Clase 5).
ε
Dado > 0, por la definición de la diferencial de g en f (x0 ), existe δ1 > 0 tal que
2M
ε
k y − f (x0 ) k< δ1 implica k g(y) − g(f (x0 )) − Dg(f (x0 ))(y − f (x0 )) k< k y − f (x0 )) k. Ası́,
2M
k x − x0 k< δ2 = min{δ0 , δ1 } implica

k g(f (x)) − g(f (x0 )) − Dg(f (x0 ))(f (x) − f (x0 )) k ε


< .
k x − x0 k 2

Como Dg(f (x0 )) es una transformación lineal, sabemos que existe 0 6= N ∈ R tal que
k Dg(f (x0 ))(y) k≤ N.kyk para todo y ∈ Rm (ver demostración de la propiedad local de Lipschitz
ε
en Clase 5). Ahora bien, por la definición de la diferencial de f , dado > 0 existe δ3 > 0 tal
2N
que k x − x0 k< δ3 implica

k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k ε


< .
k x − x0 k 2N

Entonces k x − x0 k< δ3 implica

k Dg(f (x0 ))(f (x) − f (x0 ) − Df (x0 )(x − x0 )) k k f (x) − f (x0 ) − Df (x0 )(x − x0 )) k ε
≤N < .
k x − x0 k k x − x0 k 2

Si δ = min{δ2 , δ3 }, entonces k x − x0 k< δ implica

k (g ◦ f )(x) − (g ◦ f )(x0 ) − Dg(f (x0 )).Df (x0 )(x − x0 ) k



k x − x0 k

k g(f (x)) − g(f (x0 )) − Dg(f (x0 )).(f (x) − f (x0 )) k k Dg(f (x0 ))(f (x) − f (x0 ) − Df (x0 )(x − x0 ) k
+ <
k x − x0 k k x − x0 k
ε ε
< + = ε,
2 2
lo que demuestra la fórmula. 

Como el producto de dos matrices correspondientes a dos transformaciones lineales es la


matriz correspondiente a la composición de las transformaciones que representan, la regla de la
cadena se puede reescribir diciendo lo siguiente.
La matriz jacobiana de g ◦ f en x es el producto de la matriz jacobiana de g evaluada en
y = f (x) y la matriz jacobiana de f evaluada en x (en ese orden!). Es decir, si f : A ⊂ Rn → Rm

Viviana A. Dı́az - Departamento de Matemática, UNS 36


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

es diferenciable en x y g : B ⊂ Rm → Rp es diferenciable en f (x), siendo A y B abiertos tal que


A ⊂ B, entonces
∂g1 ∂g1 ∂g1
  
∂f1 ∂f1 ∂f1 
... ...
 ∂y1 ∂y2 ∂ym 
  ∂x1 ∂x2 ∂xn 
  
 
   
 
 ∂g2 ∂g2 ∂g2 
 
 ∂f2 ∂f2 ∂f2 

... ...
  
 
 ∂y1 ∂y2 ∂ym   ∂x ∂x2 ∂xn 
 
1
[D(g ◦ f )(x)]CC 0 = .
   
  
 
 ..

.. ... .. 
  . .. .. .. 
 .  .. . . . 
 . . 
  
   
   
 
 ∂gp

∂gp ∂gp   ∂fm ∂fm ∂fm 
... ...

∂y1 ∂y2 ∂ym ∂x1 ∂x2 ∂xn
∂gi ∂fi
donde las derivadas parciales se evalúan en y = f (x) y las derivadas en x.
∂yj ∂xj
Si desarrollamos esto, obtenemos,
m
∂(g ◦ f )a X ∂ga ∂fj
= , para 1 ≤ a ≤ p y 1 ≤ b ≤ n.
∂xb j=0 ∂yj ∂xb

Esta situación aparece al realizar un “cambio de variable”. Por ejemplo, supongamos que
f (x, y) es una función escalar y x = r cos θ, y = r sen θ definen las nuevas variables r, θ en
coordenadas polares. Definimos la función h(r, θ) = f (r cos θ, r sen θ). Entonces
∂h ∂f ∂x ∂f ∂y ∂f ∂f ∂h ∂f ∂x ∂f ∂y ∂f ∂f
= + = cos θ + sen θ y = + = − r sen θ + r cos θ.
∂r ∂x ∂r ∂y ∂r ∂x ∂y ∂θ ∂x ∂θ ∂y ∂θ ∂x ∂y

3.7. La regla del producto


Otra regla bien conocida del cálculo diferencial es la regla del producto o regla de Leibniz.

Proposición 3.7.1 Regla del producto. Sean A ⊂ Rn abierto y f : A → Rm y g : A → R


funciones diferenciables. Entonces g.f es diferenciable, y para x ∈ A, D(g.f )(x) : Rn → Rm está
dada por
D(gf )(x).e = g(x)(Df (x).e) + (Dg(x).e)f (x)
para todo e ∈ Rn .

Nota: La fórmula tiene sentido pues g(x) ∈ R y Dg(x).e ∈ R.

Demostración: Dado ε > 0 y x0 ∈ A, sea δ > 0 tal que k x − x0 k< δ implique

1. |g(x)| ≤ |g(x0 )| + 1 := M (pues g es continua por ser diferenciable y


|g(x) − g(x0 )| ≥ |g(x)| − |g(x0 )| como vimos en la Clase 5).

ε
2. k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k≤ k x − x0 k (pues f es diferenciable en x0 ).
3M
Y si f (x0 ) 6= 0 y Df (x0 ) 6= 0 (si no no son necesarias las siguientes condiciones):

Viviana A. Dı́az - Departamento de Matemática, UNS 37


CAPÍTULO 3. DIFERENCIABILIDAD DE FUNCIONES DE VARIAS VARIABLES

ε
3. |g(x) − g(x0 ) − Dg(x0 )(x − x0 )| ≤ k x − x0 k (pues g es diferenciable en x0 ).
3 k f (x0 ) k
ε
4. |g(x) − g(x0 )| ≤ , (pues g es continua en x0 ).
3M
Esta elección de δ tal que se verifiquen las cuatro condiciones anteriores es posible tomando,
como en demostraciones anteriores, el mı́nimo de todos los δ que existen en cada caso por las
razones indicadas.
Entonces si k x − x0 k< δ, por la desigualdad triangular obtenemos

k g(x)f (x) − g(x0 )f (x0 ) − g(x0 )Df (x0 )(x − x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k=

k g(x)f (x)−g(x)f (x0 )−g(x)Df (x0 )(x − x0 ) + g(x)Df (x0 )(x − x0 ) − g(x0 )Df (x0 )(x − x0 )+
+g(x)f (x0 ) − g(x0 )f (x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k≤
k g(x)f (x)−g(x)f (x0 )−g(x)Df (x0 )(x−x0 ) k + k g(x)Df (x0 )(x−x0 )−g(x0 )Df (x0 )(x−x0 ) k +
k g(x)f (x0 ) − g(x0 )f (x0 ) − [Dg(x0 )(x − x0 )]f (x0 ) k=
= |g(x)| k f (x) − f (x0 ) − Df (x0 )(x − x0 ) k +|g(x) − g(x0 )| k Df (x0 )(x − x0 ) k +
k g(x) − g(x0 ) − Dg(x0 )(x − x0 ) k kf (x0 )k
ε k x − x0 k ε ε k x − x0 k
≤ M. + M0 k x − x0 k + . k f (x0 ) k= ε0 k x − x0 k 
3M 3M 3 k f (x0 ) k

A veces abreviamos este resultado diciendo que D(gf ) = gDf + (Dg)f, pero el significado
preciso es el del enunciado de la proposición.

En términos de componentes, la proposición es simplemente la regla del producto usual


∂ ∂fk ∂g
(gfk ) = g + fk .
∂xi ∂xi ∂xi

Para los cocientes, tenemos el siguiente resultado análogo al caso de una variable. Si g 6= 0,
entonces !
f g Df − (Dg)f
D = .
g g2

Demostración: Hacer como ejercicio.

Otras reglas de derivación están contenidas en la afirmación de que el diferencial D de una


función es lineal; es decir, D(f + g) = Df + Dg y D(λf ) = λ Df para todo λ ∈ R.

Viviana A. Dı́az - Departamento de Matemática, UNS 38


Capı́tulo 4

Derivadas de orden superior y teorema


de Taylor

A continuación analizaremos la fórmula de Taylor para funciones f : A ⊂ Rn → Rm ; pero,


para ello, primero analizaremos las derivadas de orden superior. Para f : Rn → R no hay
problema en definir las derivadas parciales de orden superior; simplemente iteramos el proceso
de derivación parcial !
∂ 2f ∂ ∂
= f ,
∂x1 ∂x2 ∂x1 ∂x2
etcétera. Sin embargo, con respecto a la diferencial como transformación lineal, necesitamos un
poco más de cuidado. La diferencial segunda se obtiene al diferenciar Df, si existe, lo que hacemos
del modo siguiente.

4.1. Diferencial segunda


Notamos L(Rn , Rm ) el espacio de transformaciones lineales de Rn en Rm (si elegimos una
base de Rn y otra en Rm , entonces L(Rn , Rm ) se puede identificar con las matrices m × n y por
lo tanto con Rnm ).

Definición 4.1.1 Si f : A ⊂ Rn → Rm , entonces Df : A → L(Rn , Rm ); es decir, en ca-


da x ∈ A obtenemos una transformación lineal Df (x). Si diferenciamos Df (x0 ), obtenemos
una transformación lineal de Rn en L(Rn , Rm ), por definición de la diferencial. Escribimos
D(Df )(x0 ) = D2 f (x0 ) y definimos la transformación Bx0 : Rn × Rn → Rm como Bx0 (x1 , x2 ) =
[D2 f (x0 )(x1 )](x2 ) y la llamamos la diferencial segunda de f en x0 .

Esta definición tiene sentido, pues D2 f (x0 ) : Rn → L(Rn , Rm ) y entonces D2 f (x0 )(x1 ) ∈
L(Rn , Rm ); por lo tanto, se puede aplicar a x2 y se obtiene un punto de Rm .
La razón por la que definimos la diferencial segunda como una transformación lineal de esa
forma es que considerando Bx0 se evita el uso innecesario del espacio conceptualmente difı́cil
L(Rn , L(Rn , Rm )).

Definición 4.1.2 Una aplicación bilineal B : E × F → G, donde E, F, G son espacios vec-


toriales, es una aplicación que es lineal en cada variable por separado. Esto es, si α, β ∈ R, y
e1 , e2 ∈ E, f ∈ F , vale que B(αe1 + βe2 , f ) = αB(e1 , f ) + βB(e2 , f ); y si e ∈ E, f1 , f2 ∈ F vale
que B(e, αf1 + βf2 ) = αB(e, f1 ) + βB(e, f2 ).

39
CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR

Ejercicio: Probar que la aplicación Bx0 que hemos definido es una aplicación bilineal de
Rn × Rn → Rm .

Dada una aplicación bilineal B : E × F → R, podemos asociarle una matriz con cada elección
de bases e1 , ..., en de E y f1 , ..., fm de F ; es decir, podemos hacer

aij = B(ei , fj ).

Si n m
X X
x= xi ei e y= y j fj ,
i=1 j=1

entonces   
a
  11
. . . a1m y1
aij xi yj = x1 . . . . .. ..   . 
X 
B(x, y) = xn  .. .   ..  .
.   
ij
an1 . . . anm ym
Observemos que la matriz asociada a B depende de la elección de las bases de E y F .
Nota: Para la diferencial segunda, haremos un abuso de notación y seguiremos escribiendo
2
D f (x0 ) para la aplicación bilineal Bx0 obtenida al diferenciar Df (x0 ) como se describió en los
párrafos anteriores.

Ahora veremos una definición que necesitaremos para lo que sigue, la noción de función de
clase C r .

Definición 4.1.3 Una función es de clase C r si las primeras r derivadas existen y son con-
tinuas (de forma equivalente, esto significa que todas las derivadas parciales hasta de orden r
existen y son continuas). Una función es suave o de clase C ∞ si es de clase C r para todos los
enteros positivos r.

Observación: El uso iterado de la regla de la cadena se puede usar para demostrar que la
composición de funciones C r también es C r .

Teorema 4.1.4 Sea f : A ⊂ Rn → R dos veces diferenciable en el conjunto abierto A. Entonces


la matriz de D2 f (x) : Rn × Rn → R en la base canónica está dada por

∂ 2f ∂ 2f
 
...
 ∂x1 ∂x1 ∂x1 ∂xn 
 
 .. ... .. 

 . . 

2
 ∂ f ∂ 2f 
 
...
∂xn ∂x1 ∂xn ∂xn
donde cada derivada parcial está evaluada en el punto x = (x1 , ..., xn ).

Demostración:
! La representación matricial de Df : A → L(Rn , R) es el vector fila
∂f ∂f
,..., , de modo que por la definición de la matriz jacobiana, en una versión adecuada
∂x1 ∂xn

Viviana A. Dı́az - Departamento de Matemática, UNS 40


CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR

2
para los vectores fila, D2 f : A → Rn está dada por
∂ 2f ∂ 2f ∂ 2f
 
...
 ∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn 
 
 .. .. .. .. 


 . . . . 

 ∂ 2f 2
∂ f 2
∂ f 
 
...
∂xn ∂x1 ∂xn ∂x2 ∂xn ∂xn
Si consideramos D2 f como una aplicación bilineal, la representación matricial no cambia,
como muestra un análisis de la definición.
Para las derivadas de orden superior, procedemos de forma análoga. Por ejemplo, D3 f da una
aplicación trilineal D3 f : Rn × Rn × Rn → Rm para cada x. No asociamos una matriz con esta
∂ 3 fk
aplicación, sino las derivadas de orden tres etiquetadas con cuatro ı́ndices: para cada
∂xl xj xi
componente fk .
Ahora veremos una propiedad importante de la segunda derivada que afirma que la matriz
del teorema anterior es, en condiciones muy débiles, simétrica.
Teorema 4.1.5 Simetrı́a de las derivadas cruzadas Sea f : A → Rm dos veces diferencia-
∂ 2 fk
ble en el conjunto abierto A ⊂ Rn con D2 f continua (es decir, con todas las funciones
∂xi ∂xj
continuas). Entonces D2 f es simétrica; es decir, D2 f (x)(x1 , x2 ) = D2 f (x)(x2 , x1 ) o, en términos
de componentes,
∂ 2 fk ∂ 2 fk
= .
∂xi ∂xj ∂xj ∂xi
Demostración: Mostrar que D2 f (x).(x, y) = D2 f (x).(y, x) es equivalente a establecer que
para todo i, j, k
∂ 2 fk ∂ 2 fk
= .
∂xi ∂xj ∂xj ∂xi
Manteniendo las demás variables fijas, podemos suponer que f es de clase C 2 en f : A ⊂
R2 → R (pues lo probamos para cada componente que es una función escalar y para todo par
de variables correspondiente a la derivada parcial de segundo orden). Para (x, y) ∈ A y h, k
pequeños, consideramos la cantidad
Sh,k = [f (x + h, y + k) − f (x + h, y)] − [f (x, y + k) − f (x, y)].
Definimos la función gk como gk (u) = f (u, y + k) − f (u, y), y observamos que la fórmula para
Sh,k se puede escribir como Sh,k = gk (x + h) − gk (x). Ası́, por el teorema del valor medio en una
variable, Sh,k = gk0 (ch,k ).h para algún ch,k entre x y x + h. Por lo tanto,
( ) ( ! )
∂f ∂f ∂ ∂f ∂ 2f
Sh,k = (ch,k , y + k) − (ch,k , y) h = (ch,k , dh,k ) k h = (ch,k , dh,k ).hk
∂x ∂x ∂y ∂x ∂y∂x
para algún dh,k entre y e y + k.
Pero Sh,k es “simétrica” con respecto a h, k y de x, y, ya que al intercambiar los dos términos
intermedios en Sh,k , podemos obtener (de la misma forma)
∂ 2f
Sh,k = (c̃h,k , d˜h,k ).hk.
∂x∂y

Viviana A. Dı́az - Departamento de Matemática, UNS 41


CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR

Al igualar estas dos fórmulas para Sh,k , tenemos que


∂ 2f ∂ 2f
(ch,k , dh,k ) = (c̃h,k , d˜h,k ),
∂y∂x ∂x∂y
y al hacer h → 0, k → 0 (usando la continuidad de D2 f ) obtenemos que
∂ 2f ∂ 2f
(x, y) = (x, y). 
∂y∂x ∂x∂y

La simetrı́a de las segundas derivadas representa una propiedad fundamental que no aparece
en el cálculo de una variable y el teorema 4.1.5 no es intuitivamente obvio. Sin embargo, se puede
obtener cierta intuición a partir de la idea principal de la demostración. El hecho algebraico de
que S se puede escribir como la diferencia de las diferencias de dos formas (horizontal y después
vertical, o viceversa) es la razón de la igualdad de las derivadas parciales cruzadas.

4.2. Teorema de Taylor


Veremos ahora una generalización para varias variables del teorema del Taylor que conocemos
del cálculo en una variable.

Teorema 4.2.1 Teorema de Taylor. Sea f : A → R de clase C r para A ⊂ Rn un conjunto


abierto. Sean x, y ∈ A y supongamos que A es conexo (es decir, el segmento de recta que une x
con y está contenido en A). Entonces, existe un punto c en ese segmento tal que
r−1
1 k 1
D f (x)(y − x, ..., y − x) + Dr f (c)(y − x, ..., y − x)
X
f (y) − f (x) = (4.1)
k=1 k! r!

donde Dk f (x)(y − x, ..., y − x) denota Dk f (x) como una aplicación k-lineal aplicada a la k-upla
(y − x, ..., y − x). En coordenadas,
n
∂kf
!
k
X
D f (x)(y − x, ..., y − x) = (yi1 − xi1 ) . . . (yik − xik ).
i1 ,...,ik =1 ∂xi1 ...∂xik

Haciendo y = x + h, podemos escribir la fórmula de Taylor como


1
f (x + h) = f (x) + Df (x).h + ... + Dr−1 f (x).(h, ..., h) + Rr−1 (x, h)
(r − 1)!
Rr−1 (x, h)
donde Rr−1 (x, h) es el resto. Además, lı́m = 0.
h→0 k h kr−1

Demostración: Si recordamos que


n
d X ∂f
f (x + th) = Df (x + th).h = (x + th)hi ,
dt i=1 ∂xi

entonces podemos integrar ambos miembros desde t = 0 hasta t = 1 para obtener


n
Z 1X
∂f
f (x + h) − f (x) = (x + th)hi dt.
0 i=1 ∂xi

Viviana A. Dı́az - Departamento de Matemática, UNS 42


CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR

Si integramos la expresión del miembro derecho por partes y usamos la fórmula general
Z 1
dv Z 1
du
u dt = − v dt + uv|10
0 dt 0 dt
!
∂f
con u= (x + th)hi y v = t − 1. Entonces,
∂xi
n Z 1 n Z 1 n
X ∂f X ∂ 2f X ∂f
(x + th)hi dt = (1 − t) (x + th)hi hk dt + hi (x),
i=1 0 ∂xi i,k=1 0 ∂xi ∂xk i=1 ∂xi
pues
du ∂ 2f
= (x + th)hi hk ,
dt ∂xi ∂xk
por la regla de la cadena, y
∂f ∂f
uv |10 = (t − 1) (x + th)hi |1t=0 = (x)hi .
∂xi ∂xi
Por lo tanto, hemos demostrado la identidad
n
X ∂f
f (x + h) − f (x) = (x).hi + R1 (x, h)
i=1 ∂xi

donde n Z 1
X ∂ 2f
R1 (x, h) = (1 − t) (x + th)hi hk dt.
i,k=1 0 ∂xi ∂xk
Como |hi | ≤ khk, obtenemos
 
n Z 1

X ∂ 2f 
2
|R1 (x0 , h)| ≤ khk (1 − t) (x + th) dt .

∂xi ∂xk 0
i,k=1 0
 

El integrando de la última fórmula es una función continua y, por lo tanto, está acotada en
R1 (x0 , h)
una pequeña vecindad de x0 . Ası́, obtenemos −→ 0.
khk h→0

∂ 2f (t − 1)2
Si integramos R1 (x, h) por partes nuevamente, con u = (x+th)hi hk y v=− ,
∂xi ∂xk 2
obtenemos
XZ 1 (t − 1)2 ∂ 3f X 1 ∂ 2f
R1 (x, h) = (x + th)hi hj hk dt + (x)hi hj .
i,j,k 0 2 ∂xi ∂xj ∂xk i,j 2 ∂xi ∂xj

Ası́, hemos demostrado que


n n
X ∂f X hi hj ∂ 2 f
f (x + h) = f (x) + hi (x) + (x) + R2 (x, h),
i=1 ∂xi i,j=1 2 ∂xi ∂xj

donde
XZ 1 (t − 1)2 ∂ 3f
R2 (x, h) = (x + th)hi hj hk dt.
i,j,k 0 2 ∂xi ∂xj ∂xk

Viviana A. Dı́az - Departamento de Matemática, UNS 43


CAPÍTULO 4. DERIVADAS DE ORDEN SUPERIOR Y TEOREMA DE TAYLOR

Nuevamente, como el integrando de la última fórmula es una función continua y, por lo tanto,
R2 (x0 , h)
acotada se tiene que |R2 (x, h)| ≤ khk3 M y entonces ≤ M khk −→ 0.
khk2 h→0

La fórmula para el resto establecida en la fórmula (4.1) del teorema, conocida como la fórmula
de Lagrange para el resto, se obtiene al aplicar el segundo teorema del valor medio para integrales.
Recordemos que éste teorema establece que
Z b Z b
f (x)g(x)dx = f (c) g(x)dx,
a a

siempre que f y g sean continuas, g ≥ 0 en [a, b] y c es cierto número entre a y b. Ası́,


n Z 1
∂ 2f Z 1
1
(1−t)D2 (f (x+th))(h, h) dt = D2 f (c).(h, h)
X
R1 (x0 , h) = (1−t) (x+th)hi hk dt =
i,k=1 0 ∂xi ∂xk 0 2

con c en la recta que une x con y = x + h. Análogamente,


n Z 1
(t − 1)2 ∂ 3f Z 1
(t − 1)2 D3 f (x + th).(h, h, h) dt =
X
R2 (x0 , h) = (x + th)hi hj hk dt =
i,j,k=1 0 2 ∂xi ∂xj ∂xk 0

1 3
D f (c).(h, h, h)
=
3!
con c en la recta que une x con y = x + h.
Procediendo por inducción, usando el mismo método, puede obtenerse el resultado general. 

Observación: En la demostración del teorema se muestran otras formas de expresar el


término del resto.

El teorema de Taylor nos lleva a construir la llamada serie de Taylor.

Definición 4.2.2 La serie de Taylor de una función f en las condiciones del teorema de
Taylor 4.2.1 alrededor de un punto x0 , es la serie dada por

X 1 k
D f (x0 )(x − x0 , ..., x − x0 ).
k=0 k!

Nota: Esta serie no tiene por qué converger a f (x), incluso si f es C ∞ . Si converge a f en
alguna vecindad de x0 , decimos que f es analı́tica en sentido real en x0 . Ası́, una función es
analı́tica en sentido real si el término del resto tiende a cero cuando r tiende a infinito, es decir,
1 r
lı́m
r→∞ r!
D f (c)(x − x0 , ..., x − x0 ) = 0.

Viviana A. Dı́az - Departamento de Matemática, UNS 44


Capı́tulo 5

Teoremas de la función inversa e


implı́cita

Comenzaremos con una definición y un teorema necesarios para demostrar el teorema de la


función inversa para funciones de varias variables.

Definición 5.0.1 Si V y W son espacios vectoriales normados (es decir, con una función dis-
tancia definida en ellos y sus correspondientes normas) sobre los mismos escalares entonces, si
T : V → W es una transformación lineal continua, se define la norma de la transformación
lineal T como ( )
kT (v)k
kT k := sup : 0 6= v ∈ V .
kvk

5.1. Teorema del valor medio


Teorema 5.1.1 Sea A un conjunto abierto convexo en Rn y f : Rn → Rm una función diferen-
ciable, con diferencial continua. Supongamos que k Df (x)y k≤ M kyk para todo x ∈ A e y ∈ Rn .
Entonces vale la desigualdad del valor medio:

k f (x1 ) − f (x2 ) k≤ M k x1 − x2 k .

Demostración: Si x1 , x2 ∈ A, como A es convexo, s(t) = tx1 + (1 − t)x2 ∈ A define una


d
curva continua (el segmento que une x1 y x2 ). Por la regla de la cadena, (f (tx1 + (1 − t)x2 )) =
dt
Df (tx1 +(1−t)x2 )(x1 −x2 ). Integrando componente a componente ambos miembros con respecto
a t, desde t = 0 hasta t = 1 (en el sentido de integración de una curva continua en Rm ), obtenemos
Z 1
f (x1 ) − f (x2 ) = [Df (tx1 + (1 − t)x2 ).(x1 − x2 )] dt.
0

Luego, aplicando la desigualdad triangular para la integral resulta que


Z 1 Z 1

kf (x1 )−f (x2 )k = [Df (tx1 + (1 − t)x2 ).(x1 − x2 )] dt ≤ kDf (tx1 +(1−t)x2 ).(x1 −x2 )k dt ≤
0 0
Z 1 Z 1 Z 1
≤ kDf (tx1 + (1 − t)x2 )kkx1 − x2 k dt ≤ M kx1 − x2 k dt = M kx1 − x2 k dt = M kx1 − x2 k
0 0 0

siendo kDf (tx1 + (1 − t)x2 )k la norma de la transformación lineal Df (tx1 + (1 − t)x2 ). 

45
CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

El teorema del valor medio se usa, como en el caso de una variable, para acotar el incremento
de la función en el caso en que se conozca una cota de la norma de la diferencial de la función,
aunque el cálculo exacto de la norma de una transformación lineal no suele resultar simple.

5.2. Teorema de la función inversa.


En álgebra lineal vimos que un sistema de ecuaciones lineales


 a11 x1 + · · · + a1n xn = y1
.. .. ..

 . . .
 a x + ··· + a x = y

n1 1 nn n n

tiene una única solución x1 , ..., xn si la matriz A = (aij ) no es singular; es decir, si det(A) 6= 0,
donde det(A) denota el determinante de A.
¿Qué ocurre con las ecuaciones  no lineales?

 f (x , ..., xn ) = y1
 1 1
Para un sistema de la forma .. , ¿cuándo podemos despejar x1 , ..., xn ?
 .
 f (x , ..., x ) = y

n 1 n n

El objeto que generaliza el determinante en el caso de los sistemas no lineales es el deter-


minante jacobiano, definido por Jf (x) = det(Df (x)), donde x = (x1 , ..., xn ) y f = (f1 , ..., fn ).
Escrito en coordenadas,

∂f1 ∂f1
...
∂x1 ∂xn

Jf (x) =
.
. ... .. ≡ ∂(f1 , ..., fn ) ,
. . ∂(x , ..., x )
1 n
∂fn ∂fn


∂x ...
1 ∂xn
donde las derivadas parciales se evalúan en x = (x1 , ..., xn ).
Si Jf (x) 6= 0 cabe esperar que se pueda despejar x en f (x) = y.

Como Jf (x) = det(Df (x)), Jf (x) 6= 0 implica que Df (x) : Rn → Rn es un isomorfismo


lineal (es decir, que su matriz asociada es inversible). Como la mejor aproximación lineal de f es
invertible, nos gustarı́a concluir que la propia función f es invertible.
Para calcular la derivada de la función inversa f −1 (y) en el caso de una función de una única
df −1 df
variable, usamos la regla de la cadena. Como f −1 (f (x)) = x, obtenemos . = 1 y, por lo
dy dx
tanto,
df −1

1
= df
dy y=f (x) |
dx x

En el caso de una función de varias variables, demostrar que f −1 es diferenciable requiere un


poco más de cuidado. El siguiente teorema incluye la situación de una variable como un caso
particular.

Teorema 5.2.1 Teorema de la función inversa. Sea f : A → Rn con A ⊂ Rn abierto y de


clase C 1 , es decir, Df (x) continua para x ∈ A, y Jf (x0 ) = det(Df (x0 )) 6= 0 para todo x0 ∈ A.

Viviana A. Dı́az - Departamento de Matemática, UNS 46


CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

Entonces existe r > 0 tal que B(r, x0 ) ⊂ A, f |B(r,x0 ) : B(r, x0 ) → f (B(r, x0 )) es biyectiva, donde
f (B(r, x0 )) es abierto, f −1 : f (B(r, x0 )) → B(r, x0 ) es diferenciable y vale que

D(f −1 )(y) = [Df (x)]−1

es continua para y ∈ f (B(r, x0 )). También vale que f (A) es abierto.

Decir que f tiene una inversa f −1 significa exactamente que en algún dominio de f podemos
resolver de forma única para x la ecuación f (x) = y dado cualquier y. El hecho de que exista
una solución se debe a que f es biyectiva en ese dominio.
Además, si f es biyectiva en un dominio abierto, existe una bola donde la diferencial de
la función inversa es la inversa como transformación lineal de la diferencial de la función. En
términos de matrices, la matriz de la diferencial de la función inversa es la inversa de la matriz
de la diferencial de la función.

Demostración: Probaremos en primer lugar que vale el teorema para un caso simple y luego
veremos que el caso general se reduce a este caso más simple mediante un cambio de variable en
la función dada y = f (x).

1. Caso simplificado. Supongamos Df (0) = Id, x0 = 0, f (0) = 0.

Para cada y ∈ Rn , definimos ϕy : B(a, 0) ⊂ A → Rn como ϕy (x) = x + y − f (x).


De aquı́ resulta que la condición y = f (x) equivale a que ϕy (x) = x. Esta última igualdad,
define a x como un punto fijo de ϕy .

a) Inyectividad de f : Si y ∈ Rn vale que Dϕy (x) = Id − Df (x), pues Dy = 0 (pues


y es fijo) y la diferencial
! de la identidad I(x) = x es la misma identidad ya que
∂xi
DI(x) = = δij = I.
∂xj
Evaluando Dϕy en x = 0 y, dado que por hipótesis Df (0) = I, resulta Dϕy (0) = 0.
Como Dϕy es continua por ser suma de las funciones continuas Id y Df , dado ε >
0 ∃ δ > 0 3:k Dϕy (x) − Dϕy (0) k< ε si kx − 0k < δ. Ası́, existe una bola cerrada de
1
radio δ, digamos B(δ, 0) siendo 0 < δ < a, tal que k Dϕy (x) k< (tomando ε = 1/2).
2
Entonces, aplicando el teorema del valor medio para la función ϕy , resulta para todo
par x1 , x2 ∈ B(b, 0) y cualquiera que sea y
1
k ϕy (x2 ) − ϕy (x1 ) k≤ k x2 − x1 k (5.1)
2
Es decir,
1
k (x2 − f (x2 )) − (x1 − f (x1 )) k≤ k x2 − x1 k .
2
Usando que k x − y k≥k kxk − kyk k, tenemos que
1
k kx2 − x1 k − kf (x2 ) − f (x1 )k k≤ k x2 − x1 k
2
de donde resulta
1
k f (x2 ) − f (x1 ) k≥ k x2 − x 1 k . (5.2)
2
Viviana A. Dı́az - Departamento de Matemática, UNS 47
CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

En efecto, si k kak − kbk k≤ 21 kak ⇒ − 12 k a k≤k a k − k b k≤ 1


2
kak ⇒
3 1 3 1
− k a k≤ − k b k≤ − k a k ⇒ k a k≥k b k≥ k a k .
2 2 2 2
Esto prueba que si x1 , x2 ∈ B(b, 0) y x1 6= x2 , entonces f (x1 ) 6= f (x2 ). Luego f es
inyectiva y, por lo tanto, tiene inversa f −1 : f (B(b, 0)) → B(b, 0).
b) Continuidad de f −1 : De la fórmula (5.2) se deduce también la continuidad de la
inversa de f . En efecto, si yi = f (xi ) o equivalentemente xi = f −1 (yi ) para i = 1, 2, la
desigualdad (5.2) se escribe también como

k f −1 (y2 ) − f −1 (y1 ) k≤ 2 k y2 − y1 k . (5.3)

Luego, si y2 −→ y1 resulta que f −1 (y2 ) −→ f −1 (y1 ), lo que prueba que f −1 es continua


en f (B(b, 0)) ⊂ Rn .
c) Sobreyectividad de f : Veremos que B( 2b , 0) ⊂ f (B(b, 0)), es decir, que
f : B(b, 0) → B( 2b , 0) es suryectiva.
Probaremos que si y es cercano a 0, entonces existe un punto fijo x de ϕy y, por lo
tanto, ese x es tal que y = f (x). De esto resultará que f es sobreyectiva y, como f es
inyectiva, existe la función inversa x = f −1 (y) para y próximo a 0.
Dado y ∈ B( 2b , 0), hallaremos x tal que ϕy (x) = x mediante el siguiente método (de
la aplicación contractante):
Sea x1 ∈ B(b, 0) arbitrario. Definimos la sucesión x1 , x2 , ..., xn , ... mediante el siguiente
algoritmo: x2 = ϕy (x1 ), x3 = ϕy (x2 ), ..., xn = ϕy (xn−1 ), ...
Entonces

k x2 k=k ϕy (x1 ) k=k y + x1 − f (x1 ) k≤k y k + k x1 − f (x1 ) k (5.4)

Usando (5.1) resulta para x0 = 0 y recordando que f (0) = 0 por la hipótesis del caso
1,
1 1 b
k x1 −f (x1 ) k=k x1 −f (x1 )−(0−f (0)) k=k ϕ0 (x1 )−ϕ0 (0) k≤ kx1 −0k ≤ kx1 k ≤ .
2 2 2
b b
Como y ∈ B( 2b , 0), kyk ≤ b
2
y luego, por 5.4, kx2 k ≤ + = b, es decir, que
2 2
x2 ∈ B(b, 0).
Con un razonamiento similar, se prueba que x3 = ϕy (x2 ) ∈ B(b, 0) y, en general, si se
define recursivamente xk = ϕy (xk−1 ) resulta xk ∈ B(b, 0).

Por otro lado, usando (5.1) se tiene que


1
kx3 − x2 k =k ϕy (x2 ) − ϕy (x1 ) k≤ kx2 − x1 k,
2
1 1
kx4 − x3 k =k ϕy (x3 ) − ϕy (x2 ) k≤ kx3 − x2 k ≤ kx2 − x1 k,
2 22
1 1
kx5 − x4 k =k ϕy (x4 ) − ϕy (x3 ) k≤ kx4 − x3 k ≤ kx2 − x1 k.
2 23

Viviana A. Dı́az - Departamento de Matemática, UNS 48


CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

1
En general, asumiendo kxk − xk−1 k ≤ kx2 − x1 k resulta
2k−2
1 1
kxk+1 − xk k =k ϕy (xk ) − ϕy (xk−1 ) k≤ kxk − xk−1 k ≤ k−1 kx2 − x1 k.
2 2
1
Luego, por inducción, la fórmula k xk − xk−1 k≤ k−2 k x2 − x1 k es válida para todo
2
1 < k ∈ N.

Si e > k son dados, entonces xe − xk = (xe − xe−1 ) + (xe−1 − xe−2 ) + . . . + (xk+1 − xk ).


Por lo anterior, resulta luego que

kxe − xk k ≤ kxe − xe−1 k + kxe−1 − xe−2 k + . . . + kxk+1 − xk k ≤


1 1 1
 
≤ + + ... + kx2 − x1 k.
2e−2 2e−3 2k−1
Usando la fórmula de la suma de una progresión geométrica tenemos que

1 1 1 1 1 − (1/2)e−k 1 1 1
+ + ... + = . < k−1 . = k−2 .
2e−2 2e−3 2k−1 2 k−1 1 − 1/2 2 1/2 2

kx2 − x1 k
Finalmente, resulta ası́ que kxe − xk k ≤ .
2k−2
kx2 − x1 k
Como kx2 − x1 k es fijo (no depende de k), resulta → 0 para k → ∞.
2k−2
Luego, por el criterio de Cauchy, la sucesión xk es convergente, es decir, existe x tal que
xk → x para k → ∞. Como los xk ∈ B(b, 0) y B(b, 0) es cerrado, resulta x ∈ B(b, 0).
Finalmente teniendo en cuenta que ϕy es continua y pasando al lı́mite, resulta:
ϕy cont  
z}|{
x = lı́m xk = lı́m ϕy (xk−1 ) = ϕy lı́m xk−1 = ϕy (x).
k→∞ k→∞ k→∞

Es decir, que x = ϕy (x) = y + x − f (x) y, por lo tanto, y = f (x).


Ası́, hemos probado que dado y ∈ B( 2b , 0) existe x ∈ B(b, 0) tal que y = f (x). Luego
f −1 está definida en B( 2b , 0), dado que es inyectiva y sobreyectiva en esa bola (hemos
visto que f −1 es continua en f (B(b, 0)), luego lo es en B(b/2, 0)), por lo que existe en
B( 2b , 0).
Se tiene ası́ que B( 2b , 0) ⊂ f (B(b, 0)), pues dado y ∈ B( 2b , 0) existe x ∈ B(b, 0) tal que
f (x) = y.
d) Diferenciabilidad de f −1 : Probaremos ahora que existe el diferencial de f −1 en 0
y que es la transformación identidad. Para ello, dado y ∈ B(b/2, 0), queremos probar
que
k f −1 (y) − f −1 (0) − Id(y) k kx − f (x)k
= −→ 0.
ky − 0k kf (x)k x→0
Es decir, queremos probar que dado ε > 0 vale que

kx − f (x)k ≤ εkf (x)k

Viviana A. Dı́az - Departamento de Matemática, UNS 49


CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

para f (x) = y suficientemente cercano a 0.


Como f es diferenciable en 0, f (0) = 0 y Df (0) = Id, sabemos que
kf (x) − f (0) − Id(x)k kf (x) − xk
= −→ 0,
kx − 0k kxk y→0

por lo que dado ε > 0 tenemos que kf (x) − xk ≤ ε̃kxk, si x es suficientemente cercano
a cero. Entonces podemos escribir

kf (x) − xk ≤ ε̃kxk = ε̃ kf −1 (y) − f −1 (0)k ≤ ε̃εkyk,

por la continuidad de f −1 en 0 ya probada. Ası́, resulta que

kf (x) − xk ≤ ε kf (x)k

y queda probado que Df −1 (0) = I.

2. Caso general.
Sea y0 = f (x0 ). Se hace el siguiente cambio de las variables x, y por las variables u, v siendo
v = y − y0 y u = Df (x0 )(x − x0 ). Luego, como Df (x0 ) 6= 0, x = [Df (x0 )]−1 u + x0 .
Reemplazando las variables x, y por las nuevas variables u, v en y = f (x), se obtiene
y = v + y0 = f ([Df (x0 )]−1 u + x0 ) = f (x) y, luego,

v = f ([Df (x0 )]−1 u + x0 ) − y0 = F (u).

Se verifica fácilmente que F (0) = 0 y, por la regla de la cadena, se tiene



df dx
DF (0) = . = Df (x0 )[Df (x0 )]−1 = I. (5.5)
dx du u=0

Es decir, la función v = F (u), cumple las hipótesis del caso simplicado por lo que
puede hallarse b > 0 tal que k I − DF (u) k≤ 21 para u ∈ B(b, 0) y, por lo tanto, existe
F −1 : B(b/2, 0) → Rn .
Entonces, existe δ > 0 tal que f −1 : B(δ, y0 ) → Rn (ver esto en detalle como ejercicio).
Por lo tanto, para x0 ∈ A, existe δ = δ(x0 ) tal que B(δ, y0 ) ⊆ f (A) y ası́, en particular,
resulta que f (A) es abierto.
La diferenciabilidad de F −1 en u = 0 es equivalente a la diferenciabilidad de f −1 en
y = y0 pues, como por (5.5) tenemos que DF (0) = Df (x0 )[Df (x0 )]−1 , entonces vale
que
Df −1 (y0 ) = [Df (x0 )]−1 DF −1 (0).
Luego, como DF −1 (0) = [DF (0)]−1 = I, obtenemos que Df −1 (y0 ) = [Df (x0 )]−1 .
Finalmente, para ver que f −1 : B(δ, y0 ) → Rn es continua basta observar que, según
se probó, para y = f (x) ∈ B(δ, y0 ) vale

Df −1 (y) = [Df (x)]−1 = [Df (f −1 (y))]−1 ,

y como Df (x) y f −1 (y) son continuas, resulta Df −1 (y) continua por ser composición
de funciones continuas. Para terminar la demostración basta tomar r > 0 tal que
B(r, x0 ) ⊆ f −1 (B(δ, y0 )). 

Viviana A. Dı́az - Departamento de Matemática, UNS 50


CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

5.3. Teorema de la función implı́cita


En el estudio del teorema de la función implı́cita, nuevamente nos interesa la existencia y
diferenciabilidad de funciones definidas implı́citamente.
Consideramos aquellos x e y relacionados mediante la ecuación F (x, y) = 0. Queremos saber
si esta ecuación define de forma implı́cita una función y = f (x) y, si esta función f existe, calcular
dy
.
dx
Dada una tal F , por lo general no se puede despejar y explı́citamente, por lo que es importante
saber si tal función f existe y saber cómo hacer cálculos con ella sin tener que despejarla.
En el caso general en varias variables, consideremos una función F : Rn × Rm → Rm y
estudiemos la relación F (x, y) = 0 o, equivalentemente,


 F1 (x1 , ..., xn , y1 , ..., ym ) = 0
..

 .
Fm (x1 , ..., xn , y1 , ..., ym ) = 0

El objetivo es despejar de las m ecuaciones las m incógnitas y1 , ..., ym en términos de x1 , ..., xn .

Teorema 5.3.1 Teorema de la función implı́cita. Sean A ⊂ Rn ×Rm un conjunto abierto y


F : A → Rm una función de clase C p (es decir, suponemos que F tiene p diferenciales continuas,
donde p ∈ N). Supongamos que (x0 , y0 ) ∈ A y F (x0 , y0 ) = 0. Consideremos el determinante
∂F1 ∂F1

...
∂y1 ∂ym

. .. ..
∆= . .
. .
∂Fm ∂Fm


∂y ...
1 ∂ym

donde F = (F1 , ..., Fm ), y supongamos también que ∆(x0 , y0 ) 6= 0. Entonces existen un entorno
abierto U ⊂ Rn de x0 , un entorno V de y0 en Rm y una única función f : U → V tal que

F (x, f (x)) = 0

para todo x ∈ U. Además, f es de clase C p .

Demostración: Probaremos este teorema utilizando el teorema de la función inversa aplicado


a la transformación (x, y) 7→ (x, F (x, y)).
Para x cercano a x0 , queremos hallar y = f (x) tal que F (x, y) = 0.
Definamos la función G : A ⊂ Rn × Rm → Rn × Rm como G(x, y) = (x, F (x, y)). La idea
es demostrar que G es localmente invertible cerca de (x0 , y0 ) y tomar f (x) determinada por
(x, f (x)) = G−1 (x, 0).
Como F es de clase C p y la transformación identidad es de clase C ∞ , se sigue que G es de
clase C p (por ser composición de F y Id). La matriz de derivadas parciales, es decir, la matriz

Viviana A. Dı́az - Departamento de Matemática, UNS 51


CAPÍTULO 5. TEOREMAS DE LA FUNCIÓN INVERSA E IMPLÍCITA

jacobiana de G es
1 0 ... 0 0 ... 0
 

 0 1 ... 0 0 ... 0 

 .. .. .. .. .. .. ..

 . . . . . . .

 
 0 0 ...1 0 ... 0 
 
 ∂F1 ∂F1 ∂F1 ∂F1 

... ... ... 
 ∂x1 ∂xn ∂y1 ∂ym 
 
 . .. .. .. .. 
 . .. ..
 . . . . . . . 

 ∂Fm ∂Fm ∂Fm ∂Fm 
 
... ... ...
∂x1 ∂xn ∂y1 ∂ym

El determinante de esta matriz evaluado en (x0 , y0 ) es igual a


∂F1 ∂F1

...
∂y1 ∂ym

. .. .. (x , y ).
∆(x0 , y0 ) = . .
. . 0 0
∂Fm ∂Fm


∂y ...
1 ∂ym

Por hipótesis, JG(x0 , y0 ) 6= 0 y entonces, por el teorema de la función inversa, existe un


conjunto abierto W que contiene a (x0 , 0) y un conjunto abierto S que contiene a (x0 , y0 ) tales
que G(S) = W y G tiene una inversa G−1 : W → S de clase C p .
Por definición de conjunto abierto, si S es abierto, existen conjuntos abiertos U ⊂ Rn y
V ⊂ Rm , con x0 ∈ U e y0 ∈ V, tales que U × V ⊂ S.
Sea G(U × V ) = Y ⊂ W. Ası́, G : U × V → Y es un difeomorfismo de clase C p (esto es, que
G es de clase C p y que tiene inversa G−1 : Y → U × V, también de clase C p ).
Ahora, G−1 es de la forma G−1 (x, w) = (x, H(x, w)), donde H es una función C p de Y en V,
pues G es de esta forma, como es fácil de ver.
Sea π : Rn ×Rm → Rm dada por π(x, y) = y, de modo que F (x, H(x, w)) = π◦ G(x, H(x, w)) =
π ◦ G ◦ G−1 (x, w) = w.
Como G−1 es de la forma G−1 (x, w) = (x, H(x, w)), x ∈ U si (x, w) ∈ Y.
Definamos f : U → V por f (x) = H(x, 0). Como F (x, H(x, w)) = w, obtenemos F (x, f (x)) =
0 (pues (x, f (x)) = G−1 (x, 0)) y como H es de clase C p , f también es de clase C p .
Por el teorema de la función inversa, H(x, w) está determinada en forma única y, como f
debe estar dada por H(x, 0), f también es única. 

El teorema de la función implı́cita afirma entonces que, si se cumplen sus condiciones, se


podrán despejar y1 , . . . , ym en función de las restantes variables x1 , . . . , xn de F .

Viviana A. Dı́az - Departamento de Matemática, UNS 52


Capı́tulo 6

Sucesiones y continuidad

6.1. Sucesiones
La definición de convergencia de una sucesión en Rn es similar a la de convergencia de una
sucesión de números reales. De hecho, la definición tiene perfecto sentido en un espacio métrico.

Definición 6.1.1 Sea (M, d) un espacio métrico y xk una sucesión de puntos en M . Decimos
que xk converge a un punto x ∈ M y escribimos

lı́m xk = x, o xk → x cuando k → ∞,
k→∞

si para todo conjunto abierto U que contiene a x existe un N tal que xk ∈ U si k ≥ N.

Esta definición coincide con la definición usual, como lo muestra la siguiente proposición.

Proposición 6.1.2 Una sucesión xk en M converge a x ∈ M si y solo si para todo ε > 0 existe
N tal que k ≥ N implica d(x, xk ) < ε.

Demostración: Como ejercicio.


En particular, en el caso de Rn , la definición de convergencia es: una sucesión de puntos
vk ∈ Rn converge a v si para todo ε > 0 existe N tal que kvk − vk < ε si k ≥ N.
Gran parte de lo que vale en dimensión 1 sigue siendo válido en Rn pero hay otra parte
que no. Lo más destacable es que no existe un orden natural impuesto sobre Rn , por lo que no
podemos aplicar el estudio de las sucesiones monótonas a este caso general.

Proposición 6.1.3 La sucesión {vk } = {(vk1 , vk2 , . . . , vkn )} converge a v = (v 1 , v 2 , . . . , v n ) en Rn


si y solo si cada sucesión de coordenadas converge a la coordenada correspondiente de v como una
sucesión en R. Es decir, lı́m vk = v en Rn si y solo si lı́m vki = v i en R para cada i = 1, 2, . . . , n.
k→∞ k→∞

Demostración: Si δ(v, vk ) = max{|v 1 − vk1 |, . . . , |v n − vkn |} entonces δ(v, vk ) ≤ kv − vk k. Si


vk → v en Rn , 1 ≤ j ≤ n y ε > 0, entonces existe un K tal que kv − vk k < ε siempre que k ≥ K.
En consecuencia, para ese k, tenemos que |v j − vkj | ≤ δ(v, vk ) ≤ kv − vk k < ε, por lo que vkj → v j
en R.
Supongamos que para cada j = 1, 2, . . . , n lı́m vkj = v j y sea ε > 0. Para todo ε0 > 0 existen
k→∞
K1 , K2 , . . . , Kn tales que |v 1 − vk1 | < ε0 si k ≥ K1 , |v 2 − vk2 | < ε0 si k ≥ K2 , ... |v n − vkn | < ε0

53
CAPÍTULO 6. SUCESIONES Y CONTINUIDAD

si k ≥ Kn . Como solo hay un √ número finito√de Ki , tomamos K = max(K1 , K


√2 , . . . , Kn ). Si
k ≥ K, tenemos que kv − vk k ≤ nδ(v, vk ) ≤ nε0 . Si hacemos esto con ε0 = ε/ n, obtenemos
kv − vk k < ε cuando k ≥ K, ası́ que vk → v en Rn . 
Esto puede escribirse de forma más compacta como
lı́m (vk1 , vk2 , . . . , vkn ) = ( lı́m vk1 , lı́m vk2 , . . . , lı́m vkn ).
k→∞ k→∞ k→∞ k→∞

Las sucesiones pueden emplearse para determinar si un conjunto es cerrado. El método es el


siguiente:
Proposición 6.1.4 Un conjunto A ⊂ M es cerrado si y solo si para cada sucesión xk ∈ A que
converge en M , el lı́mite es un elemento de A.

Demostración: En primer lugar, supongamos que A es cerrado, y que xk → x. Entonces x


es un punto de acumulación de A, ya que cualquier entorno de x contiene a xk ∈ A para un k
suficientemente grande, por lo tanto, x ∈ A.
Recı́procamente, sean x un punto de acumulación de A y elijamos xk ∈ B(x, 1/k) ∩ A.
Entonces xk → x, ya que para cada ε > 0 podemos elegir N ≥ 1/ε, con lo que k ≥ N implica
xk ∈ B(x, ε). Por hipótesis x ∈ A, luego A es cerrado. 

En un espacio métrico general, o incluso en Rn , los conceptos de sucesión monótona y supremo


no tienen sentido. Sin embargo, la caracterización de la completitud por medio de las sucesiones
de Cauchy sı́ lo tiene.
Definición 6.1.5 Sea (M, d) un espacio métrico. Una sucesión de Cauchy es una sucesión
xk ∈ M tal que para todo ε > 0, existe N tal que si k, l ≥ N , entonces d(xk , xl ) < ε.
Definición 6.1.6 El espacio M se dice completo si toda sucesión de Cauchy en M converge a
un punto de M .
Teorema 6.1.7 Una sucesión xk en Rn converge a un punto en Rn si y solo si es una sucesión
de Cauchy.

Demostración: Ejercicio.
Proposición 6.1.8 Sea (M, d) un espacio métrico completo y N ⊂ M un subconjunto cerrado.
Entonces N también es completo.

Demostración: Se entiende que la métrica utilizada en N es la misma que la de M . Sea xn


una sucesión de Cauchy en N . Considerada como una sucesión en M , sigue siendo una sucesión
de Cauchy. Como M es completo, esta sucesión converge en M a un punto x. Como xn ∈ N y
xn → x, x es un punto de acumulación de xn ∈ N . Dado que N es cerrado, vale que x ∈ N. Ası́,
xn converge en N y, por tanto, N es completo. 

Recordemos de nuestro estudio de sucesiones convergentes en R que toda sucesión acotada


tiene una subsucesión convergente. Podemos expresar este hecho de otra forma: si A ⊂ R es un
conjunto compacto (cerrado y acotado), entonces toda sucesión en A tiene una subsucesión que
converge a un punto de A. Dicha propiedad desempeña un papel crucial en muchos teoremas
básicos, como la existencia de máximos y mı́nimos de funciones continuas en intervalos cerrados.
Veremos lo mismo en para funciones continuas de varias variables, es decir, definidas en Rn .

Viviana A. Dı́az - Departamento de Matemática, UNS 54


CAPÍTULO 6. SUCESIONES Y CONTINUIDAD

Definición 6.1.9 Sea M un espacio métrico. Un subconjunto A ⊂ M es secuencialmente


compacto si toda sucesión en A tiene una subsucesión que converge a un punto de A.

Esta propiedad de compacidad secuencial es equivalente a la compacidad, según lo afirma el


siguiente teorema que mencionaremos sin demostración.

Teorema 6.1.10 (Teorema de Bolzano-Weierstrass) Un subconjunto de un espacio métri-


co es compacto si y solo si es secuencialmente compacto.

6.2. Funciones continuas


A continuación veremos algunos resultados sobre continuidad de funciones necesarios pa-
ra estudiar extremos en el caso de funciones de varias variables. Comenzaremos recordando la
definición de función continua.

Definición 6.2.1 Sea f : A ⊂ M → N es una función entre dos espacios métricos M y N con
métricas d y ρ, respectivamente. La función f se dice continua en un punto x0 ∈ A si para todo
ε > 0 existe δ > 0 tal que para todo x ∈ A que verifique d(x, x0 ) < δ vale que ρ(f (x), f (x0 )) < ε.

Si M = Rn y N = Rm , f es continua en x0 ∈ A si para todo ε > 0 existe δ > 0 tal que para


todo x ∈ A que verifique kx − x0 k < δ vale que kf (x) − f (x0 )k < ε.
Hay otras formulaciones útiles del concepto de continuidad, algunas de las cuales pueden
aplicarse a situaciones más generales. En el teorema siguiente veremos algunas de estas formula-
ciones.

Teorema 6.2.2 Si f : A ⊂ M → N es una función entre dos espacios métricos M y N con


métricas d y ρ, respectivamente. Entonces las siguientes afirmaciones son equivalentes:

1. f es continua en A.

2. Para cada sucesión convergente {xk }∞


n=1 tal que xk → x0 en A, tenemos que f (xk ) → f (x0 ).

3. Para cada conjunto abierto U en N , f −1 (U ) = V ∩ A para algún conjunto abierto V .

4. Para cada conjunto cerrado F ⊂ N , f −1 (F ) = G ∩ A para algún conjunto cerrado G.

Demostración: 1. ⇒ 2.) Supongamos que xk → x0 . Para mostrar que f (xk ) → f (x0 ), sea
ε > 0. Entonces elegimos δ > 0 de modo que d(x, x0 ) < δ implique que ρ(f (xk ) − f (x0 )) < ε.
La existencia de tal δ está garantizada por la continuidad de f . Entonces, elegimos N tal que
k ≥ N implique d(xk , x0 )) < δ y esta elección de N prueba el resultado.
2. ⇒ 4.) Sea F ⊂ N un conjunto cerrado. Para mostrar que f −1 (F ) es cerrado en su inter-
sección con A, observemos que esto sucede si y solo si para cada sucesión xk ∈ B que converja a
un punto x ∈ A, necesariamente ocurre que x ∈ B.
Sea xk ∈ f −1 (F ) tal que xk → x, donde x ∈ A. Debemos mostrar que x ∈ f −1 (F ).
Por el inciso 2., f (xk ) → f (x), y como f (xk ) ∈ F que es cerrado (es decir, contiene a sus
puntos de acumulación), concluimos que f (x) ∈ F. Ası́, x ∈ f −1 (F ).

Viviana A. Dı́az - Departamento de Matemática, UNS 55


CAPÍTULO 6. SUCESIONES Y CONTINUIDAD

4. ⇒ 3.) Si U es abierto, sea F = N − U su complemento que es cerrado. Entonces, por 4.,


f −1 (F ) = G ∩ A para algún conjunto cerrado G. Ası́, f −1 (F ) = A ∩ (M − G) y entonces f −1 (U )
es un abierto M − G intersectado con A.
3. ⇒ 1.) Dados x0 ∈ A y ε > 0, debemos hallar δ > 0 tal que d(x, x0 ) < δ implique que
ρ(f (x), f (x0 )) < ε. Como B(f (x0 ), ε) es un conjunto abierto, por 3. resulta que f −1 (B(f (x0 ), ε))
es abierto. Ası́, por la definición de conjunto abierto y el hecho de que x0 ∈ f −1 (B(f (x0 ), ε)),
existe δ > 0 tal que B(x0 , δ) ∩ A ⊂ f −1 (B(f (x0 ), ε)). Esta es otra forma de decir que:
si x ∈ A y d(x, x0 ) < δ ⇒ ρ(f (x), f (x0 )) < ε 

Teorema 6.2.3 Supongamos f : M → N una función continua entre dos espacios métricos M
y N con métricas d y ρ, respectivamente, y B ⊂ M un conjunto compacto. Entonces f (B) es
compacto.

Demostración: Sea {yk }∞ n=1 una sucesión en f (B). Por el teorema (6.1.10), debemos mostrar
que yk tiene una subsucesión convergente a un punto en f (B). Sea yk = f (xk ) para xk ∈ B. Como
B es compacto, existe una subsucesión convergente, digamos xkn → x, con x ∈ B. Entonces, por
el teorema (6.2.2), vale que f (xkn ) → f (x) y luego f (xkn ) es una subsucesión convergente de yk
con lı́mite en f (B). 

Teorema 6.2.4 Sean M, N, P espacios métricos y supongamos que f : A ⊂ M → N y g : B ⊂


N → P son funciones continuas tales que f (A) ⊂ B. Entonces g ◦ f : A ⊂ M → P es continua.

Demostración: Sea U ⊂ P un conjunto abierto. Entonces (g ◦ f )−1 (U ) = f −1 (g −1 (U )).


Ahora, por teorema (6.2.2), g −1 (U ) = U 0 ∩ B para algún conjunto abierto U 0 y f −1 (U 0 ∩ B) =
f −1 (U 0 ), pues f (A) ⊂ B. Como f es continua, f −1 (U 0 ) = U 00 ∩ A para U 00 abierto. Ası́, g ◦ f es
continua, por el teorema (6.2.2). 

Viviana A. Dı́az - Departamento de Matemática, UNS 56


Capı́tulo 7

Extremos de funciones de varias


variables

7.1. Extremos absolutos


Luego de estudiar las funciones continuas de valores reales, estamos en condiciones de demos-
trar una importante propiedad de ellas llamada el teorema del “máximo-mı́nimo” o de “acota-
ción”. Este resultado dice que una función continua está acotada sobre un conjunto compacto y
alcanza su valor máximo y su valor mı́nimo en algún punto del conjunto.

Teorema 7.1.1 Teorema del máximo-mı́nimo. Sean (M, d) un espacio métrico, A ⊂ M y


f : A → R una función continua. Sea K ⊂ A un conjunto compacto. Entonces f está acotada en
K; es decir, S = {f (x) : x ∈ K} ⊂ R es un conjunto acotado. Además, existen puntos x0 , x1 ∈ K
tales que f (x0 ) = inf (S) y f (x1 ) = sup(S).

Demostración: En primer lugar, S está acotado superiormente (en R), ya que S = f (K) es
compacto por el Teorema 1.3.3 de la clase pasada y, por lo tanto, es cerrado y acotado.
En segundo lugar, queremos obtener x1 tal que x1 ∈ K y f (x1 ) = sup(S). Ahora bien, si
s = sup(S), para todo ε > 0, B(s, ε) contiene un punto de S, si no fuese ası́, s − ε serı́a una cota
superior para S menor que sup(S). Luego, s ∈ cl(S). Como S es cerrado, sabemos que S = cl(S)
y entonces s = sup(S) ∈ S = f (K). Entonces, sup(S) = f (x1 ) para algún x1 ∈ K. Análogamente
se prueba el caso de inf (S). 
Observación: Los valores x0 y x1 no necesariamente son únicos.

Definición 7.1.2 Decimos que sup(f (K)), cuya existencia probamos en el teorema anterior, es
el máximo (absoluto) de f en K, y al inf (f (K)) lo llamamos mı́nimo (absoluto) de f en
K.

7.2. Extremos relativos


En el cálculo de una variable real se considera el problema de investigar los extremos de
funciones derivables y = f (x). La condición necesaria para la existencia de extremo relativo de
f (x) en x = a es que f 0 (a) = 0. Un estudio posterior da condiciones suficientes para la existencia
de máximo o mı́nimo en términos de la derivada segunda f 00 (x) en x = a.

57
CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

En lo que sigue se trata de generalizar estos resultados, o al menos parte de ellos, para
funciones de varias variables. Comenzamos con algunas definiciones.

Definición 7.2.1 Sea f : A ⊂ Rn → R donde A es abierto. Si existe un entorno de x0 ∈ A en el


que f (x0 ) es un máximo, es decir, si f (x0 ) ≥ f (x) para todo x en el entorno, decimos que x0 es
un punto de máximo local y f (x0 ) es un valor máximo local de f. Análogamente, podemos
definir un mı́nimo local de f.
Un punto se llama extremo (local) de f si es un máximo local o un mı́nimo local de f.

Definición 7.2.2 Sea f : A ⊂ Rn → R donde A es abierto. Un punto x0 ∈ A es un punto


crı́tico de la función f si f es diferenciable en x0 y si Df (x0 ) = 0.

El primer hecho básico aparece en el siguiente teorema.

Teorema 7.2.3 Si f : A ⊂ Rn → R es diferenciable, A es abierto y x0 ∈ A es un punto extremo


de f , entonces Df (x0 ) = 0; es decir, x0 es un punto crı́tico.

Demostración: Si Df (x0 ) 6= 0, existe x ∈ Rn tal que Df (x0 )(x) = c 6= 0; digamos que


c > 0. Si c < 0, la demostración es análoga.
c
Como f es diferenciable en x0 , considerando ε = , sabemos que existe δ > 0 tal que si
2kxk
khk < δ, entonces
c
k f (x0 + h) − f (x0 ) − Df (x0 )h k≤ khk.
2kxk
Sea λ > 0 tal que λkxk < δ. Si elegimos h = λx, obtenemos
cλkxk cλ
kf (x0 + λx) − f (x0 ) − Df (x0 )λxk ≤ = .
2kxk 2
Como Df (x0 ) es lineal, Df (x0 )(λx) = λDf (x0 )(x) = λc, obtenemos f (x0 + λx) − f (x0 ) > 0.
Análogamente,

kf (x0 − λx) − f (x0 ) + Df (x0 )λxk ≤ implica f (x0 − λx) − f (x0 ) < 0.
2
Como f (x0 +λx) > f (x0 ) y f (x0 −λx) < f (x0 ), vemos que f (x0 ) no es un valor extremo local.
Es decir, podemos determinar puntos y arbitrariamente cercano a x0 tales que f (y) > f (x0 ) y,
análogamente, existen puntos y arbitrariamente cercanos a x0 tales que f (y) < f (x0 ). El absurdo
provino de suponer que Df (x0 ) 6= 0, por lo que se tiene que Df (x0 ) = 0. 

El resultado es intuitivamente claro, pues en un punto extremo la gráfica de f debe tener


un plano tangente horizontal. Sin embargo, el solo hecho de ser un punto crı́tico no es suficiente
para garantizar que el punto sea extremo.
Para generalizar el criterio de la derivada segunda en una variable, introducimos el concepto
de función hessiana de una función en un punto.

Definición 7.2.4 Si g : B ⊂ Rn → R es de clase C 2 , la hessiana de g en x0 se define como la


función bilineal Hx0 (g) : Rn × Rn → R dada por

Hx0 (g)(x, y) = D2 g(x0 )(x, y).

Ası́, la hessiana como matriz es simplemente la matriz de las segundas derivadas parciales.

Viviana A. Dı́az - Departamento de Matemática, UNS 58


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

Definición 7.2.5 Una aplicación bilineal B : Rn × Rb → R, se dice definida positiva si


B(x, x) > 0 para todo x 6= 0 en Rn ; y es semidefinida positiva si B(x, x) ≥ 0 para todo
x ∈ Rn . Las formas bilineales definidas negativas y semidefinidas negativas se definen en
forma análoga.

Podemos hacer la siguiente generalización del criterio de la derivada segunda en una variable
para el caso de varias variables.

Teorema 7.2.6 Sea f : A ⊂ Rn → R una función de clase C 2 definida en un conjunto abierto


A y x0 ∈ A. Entonces:
1. Si x0 es un punto crı́tico de f tal que Hx0 (f ) es definida negativa, entonces f tiene un
máximo local en x0 .
2. Si f tiene un máximo local en x0 , entonces Hx0 (f ) es semidefinida negativa.
3. Si x0 es un punto crı́tico de f tal que Hx0 (f ) es definida positiva, entonces f tiene un
mı́nimo local en x0 .
4. Si f tiene un mı́nimo local en x0 , entonces Hx0 (f ) es semidefinida positiva.

Demostración:
1. Si Hx0 (f ) es definida negativa, entonces Hx0 (f )(x, x) < 0 para todo x 6= 0 en Rn . Por
la definición de la hessiana, esto implica que D2 f (x0 )(x, x) < 0 para todo x 6= 0 en Rn .
Como Df (x0 )(x) es una función continua de x, vale que D2 f (x0 )(x, x) es continua (por ser
composición de funciones continuas). Además, S = {x ∈ Rn : kxk = 1} es compacto, por
lo que existe un punto x̃ ∈ S tal que 0 > D2 f (x0 )(x̃, x̃) ≥ D2 f (x0 )(x, x) para!todo x ∈ S.
x x
Sea ε = −D2 f (x0 )(x̃, x̃). Entonces D2 f (x0 )(x, x) = kxk2 D2 f (x0 ) , ≤ −εkxk2
kxk kxk
para todo x 6= 0 en Rn . Como D2 f es continua, existe δ > 0 tal que ky − x0 k < δ implica
ε
k D2 f (y) − D2 f (x0 ) k< , y podemos también elegir δ de modo que B(x0 , δ) ⊂ A.
2
1
Si y ∈ B(x0 , δ), el teorema de Taylor nos da f (y) − f (x0 ) = Df (x0 )(y − x0 ) + D2 f (c)(y −
2
x0 , y − x0 ), donde c ∈ B(x0 , δ). Ası́,
ε
k D2 f (c) − D2 f (x0 ) k<
2
implica
D2 f (c)(y − x0 , y − x0 ) ≤ D2 f (x0 )(y − x0 , y − x0 )+
k D2 f (c)(y − x0 , y − x0 ) − D2 f (x0 )(y − x0 , y − x0 ) k
ε ε
≤ −ε k y − x0 k2 + k y − x0 k2 = − k y − x0 k2 .
2 2
Como Df (x0 ) = 0, el teorema de Taylor implica
1 1 ε
 
f (y) − f (x0 ) = D2 f (c)(y − x0 , y − x0 ) ≤ − k y − x0 k2 < 0.
2 2 2
Por lo tanto, f (y) < f (x0 ) para todo y ∈ B(x0 , δ), y 6= x0 por lo que f tiene un máximo
local en x0 .

Viviana A. Dı́az - Departamento de Matemática, UNS 59


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

2. Demostraremos esta parte del teorema por reducción al absurdo.


Sea f una función con un máximo local en x0 y supongamos que D2 f (x0 )(x, x) > 0 para
algún x ∈ Rn . Ahora consideremos g(t) = −f (x0 + tx). Como f está definida en un entorno
de x0 , g está definida en un entorno de 0. Tenemos que D2 g(0)(1, 1) = −D2 f (x0 )(x, x) < 0.
Usamos la demostración del inciso anterior para afirmar que existe δ tal que si |t| < δ, t 6= 0,
entonces g(t) < g(0). Ası́, |t| < δ implica f (x0 + tx) > f (x0 ), por lo que f no tiene un
máximo local en x0 . Esta contradicción implica que D2 f (x0 )(x, x) ≤ 0 para todo x ∈ Rn .
Por lo tanto, Hx0 (f )(x, x) ≤ 0 para todo x ∈ Rn . 

Nota: Observemos que un mı́nimo de f es un máximo de −f.

El polinomio de Taylor de segundo orden define la función cuadrática que mejor aproxima a la
gráfica de la función. El criterio de la diferencial segunda dice entonces que podemos determinar
el comportamiento en un punto crı́tico analizando el término de segundo orden del polinomio de
Taylor de la función.
Como hemos observado, la matriz de Hx0 (f ) = D2 f (x0 ) en la base canónica es

∂ 2f ∂ 2f ∂ 2f
 
...
 ∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn 
 
 .. .. .. .. 

 . . . . 

 ∂ 2f ∂ 2f ∂ 2f 
 
v ...
∂xn ∂x1 ∂xn ∂x2 ∂xn ∂xn
donde las derivadas parciales se evalúan en x0 .
Si n = 1, el teorema 7.2.6 se reduce al criterio f 00 (x0 ) < 0 para una variable; si f 00 (x0 ) = 0, se
puede tener un máximo, un mı́nimo o un punto silla (en este caso, el criterio falla).

Algunos resultados del álgebra lineal serán de utilidad al usar el teorema 7.2.6.
Sea ∆k el determinante de la matriz Hx0 (f ) = D2 f (x0 ) en la base canónica es

∂ 2f ∂ 2f ∂ 2f
 
...
 ∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂xk 
 
 .. .. ... .. 
,

 . . . 
 ∂ 2f 2
∂ f 2
∂ f 
 
...
∂xk ∂x1 ∂xk ∂x2 ∂xk ∂xk
es decir, el determinante de la matriz hessiana de f con las últimas n − k filas y columnas
eliminadas. Este determinante proporciona un criterio para afirmar cuándo la matriz simétrica
asociada a la bilineal Hx0 (f ) = D2 f (x0 ) es definida positiva, lo que es equivalente a que la bilineal
Hx0 (f ) = D2 f (x0 ) sea definida positiva. De hecho, vale que la matriz simétrica Hx0 (f ) = D2 f (x0 )
es definida positiva si y solo si ∆k > 0 para k = 1, ..., n.
No demostraremos esto en general pero lo probaremos para las matrices de orden dos en un
ejercicio.
Ası́, por el teorema 7.2.6, tenemos el siguiente criterio para determinar si en un punto crı́tico
una función tiene un mı́nimmo local.

Viviana A. Dı́az - Departamento de Matemática, UNS 60


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

Si ∆k > 0 para k = 1, ..., n, entonces f tiene un mı́nimo (local) en el punto crı́tico x0 .

Al cambiar el signo de Hx0 y usar las propiedades dde los determinantes, tenemos que
Hx0 (f ) = D2 f (x0 ) es definida negativa si y solo si ∆k < 0 par k impar y ∆k > 0 para k
par, por lo que tenemos
(
∆k < 0, para k impar
f tiene un máximo en x0 si
∆k > 0, para k par

Si ∆k > 0 para algún k impar o ∆k < 0 para algún k par, entonces f no puede tener un
valor mı́nimo en x0 . De hecho, si ∆k < 0 para algún k par, f no puede tener ni un máximo
ni un mı́nimo en x0 , y x0 debe ser un punto silla de f .

7.3. Extremos condicionados


7.3.1. Geometrı́a de los gradientes
Recordemos que si f : A ⊂ Rn → ! R es una función diferenciable, el gradiente de f está dado
∂f ∂f
por ∇f = grad(f ) = , ..., . Por lo tanto, como vimos, la derivada direccional en la
∂x1 ∂xn
dirección h es Df (x).h = h∇f (x), hi, por lo que la derivada direccional de f está dada por el
gradiente de la función en el punto.
La siguiente proposición muestra otra propiedad geométrica del gradiente.

Proposición 7.3.1 Sea f : A ⊂ Rn → R una función diferenciable y S la “superficie” definida


por f (x) = k con k ∈ R. Entonces ∇f es ortogonal a esta superficie S.

Demostración: Consideremos una curva r(t) en S con vector tangente en t0 dado por r0 (t0 ),
donde r(t0 ) = x0 . Veamos que h∇f (x0 ), r0 (t0 )i = 0.
Como r(t) ∈ S, f (r(t)) = k para todo t. Derivamos esta expresión usando la regla de la
cadena para obtener Df (r(t)).r0 (t) = 0 para todo t. En particular vale para t = t0 , es decir,
Df (r(t0 )).r0 (t0 ) = h∇f (x0 ), r0 (t0 )i = 0. 
En otras palabras, podemos afirmar que el vector gradiente es ortogonal a las superficies de
nivel de la función en el punto.

Viviana A. Dı́az - Departamento de Matemática, UNS 61


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

De hecho, si suponemos que f representa la función altura de una montaña, entonces f = k


es un contorno de nivel y para subir o descender de la montaña lo más pronto posible, debemos
caminar en forma perpendicular a los contornos de nivel, que en el caso de una montaña son
curvas de nivel.

Otras propiedades geométricas del gradiente son:

1. Podemos describir a la variedad tangente a la superficie S definida por f (x) = k en un


punto x0 en S como h∇f (x0 )), x − x0 i = 0.
En efecto,
n
* ! +
∂f ∂f ∂f 1 1 2 2 n n
X ∂f i i
0 = h∇f (x0 ), x−x0 i = 1
, 2,..., , (x − x0 , x − x0 , . . . , x − x0 ) = i
(x −x0 )
∂x ∂x ∂xn i=1 ∂x

es efectivamente la ecuación de la variedad tangente que hemos definido.


En el caso particular de una función f : R3 → R, el gradiente de f en un punto puede
tomarse como un vector normal al plano tangente de la superficie f (x, y, z) = k en el punto.

Viviana A. Dı́az - Departamento de Matemática, UNS 62


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

2. A partir de la ecuación de la derivada direccional

Df (x0 ).h = h∇f (x0 ), hi = k∇f (x0 )kkhk cos(θ),

siendo khk = 1 y θ el ángulo entre ∇f (x0 ) y el vector h, y el hecho de que −1 ≤ k cos(θ) ≤ 1,


tenemos que
−k∇f (x0 )k ≤ Df (x0 ).h ≤ k∇f (x0 )k.
Ası́

k∇f (x0 )k es el valor máximo que toman las derivadas direccionales de f en x0 y se


da en el caso en que θ = 0, es decir, en el caso en que h y ∇f (x0 ) sean paralelos y con
igual sentido.
−k∇f (x0 )k es el valor mı́nimo que toman las derivadas direccionales de f en x0 y se
da en el caso en que θ = π, es decir, en el caso en que h y ∇f (x0 ) sean paralelos y de
sentido contrario.
Si θ = π/2 entonces h∇f (x0 ), hi = 0, es decir, la derivada direccional es nula en las
direcciones ortogonales al gradiente.

Entonces podemos decir que “el gradiente de la función en un punto apunta en la dirección
de máximo crecimiento de la función en ese punto”.

Pueden visualizarse el gradiente y las curvas de nivel de una función escalar con dominio en
el plano en el siguiente recurso de Geogebra: https://www.geogebra.org/m/VKU7BrFK

Viviana A. Dı́az - Departamento de Matemática, UNS 63


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

7.3.2. Extremos restringidos


Consideremos una función f : Rn → R con derivadas continuas y sea S ⊂ Rn el conjunto
definido por S = {x ∈ Rn : f (x) = 0} donde f = (f1 , . . . , fm ), con m < n.
Si el conjunto S puede parametrizarse, el problema de hallar los extremos de la función f
restringida al conjunto S se reduce a hallar los extremos de la composición de f con la parametri-
zación de S en dominios abiertos. Este proceso resulta claro y, en principio, puede aplicarse, sin
embargo en la práctica las dificultades técnicas pueden ser grandes. En parte, estas dificultades
desaparecen usando el llamado método de los multiplicadores de Lagrange, que se sustenta en el
siguiente teorema.

Teorema 7.3.2 Teorema del multiplicador de Lagrange. Sean f : U ⊂ Rn → R y g : U ⊂


Rn → R funciones C 1 dadas. Sean x0 ∈ U, g(x0 ) = c0 y S = g −1 (c0 ), el conjunto de nivel de g
con valor c0 . Supongamos que ∇g(x0 ) 6= 0. Si la restricción de f a S (es decir, aquellos x ∈ U
que satisfacen g(x0 ) = c0 ), que se nota f |S , tiene un máximo o un mı́nimo en x0 , entonces existe
un número real λ tal que
∇f (x0 ) = λ∇g(x0 ).

∂g
Demostración: Supongamos que (x0 ) 6= 0. Entonces, por el teorema de la función
∂xn
implı́cita, existe una función h tal que g(x1 , ..., xn−1 , h(x1 , ..., xn−1 )) = 0 para todo (x1 , ..., xn−1 )
en un conjunto abierto U ⊂ Rn−1 . Sea k(x1 , ..., xn−1 ) = f (x1 , ..., xn−1 , h(x1 , ..., xn−1 )). Queremos
extremar k.
Si k tiene un máximo o un mı́nimo en un punto, entonces el gradiente es el vector nulo, es
decir, usando la regla de la cadena
∂k ∂f ∂f ∂h
= + = 0. (7.1)
∂xi ∂xi ∂xn ∂xi
Pero, por otro lado, como g(x1 , ..., xn−1 , h(x1 , ..., xn−1 )) = 0, tenemos que

∂g ∂g ∂h
+ = 0. (7.2)
∂xi ∂xn ∂xi
∂h
De modo que, despejando de (7.2) y reemplazando en (7.1), para todo 1 ≤ i ≤ n − 1, vale
∂xi
∂f ∂f
∂f ∂xn ∂g ∂xn
= . . Entonces, tomando λ= obtenemos que
∂xi ∂g ∂xi ∂g
∂xn ∂xn
∂f ∂g
(x0 ) = λ (x0 ) para todo 1 ≤ i ≤ n − 1 y trivialmente de la definición de λ se verifica
∂xi ∂xi
para las derivadas parciales respecto a xn , consecuentemente, ∇f (x0 ) = λ∇g(x0 ). 

Definición 7.3.3 A la constante λ tal que ∇f (x0 ) = λ∇g(x0 ) cuya existencia se mostró en el
teorema (7.3.2) se la llama multiplicador de Lagrange.

Viviana A. Dı́az - Departamento de Matemática, UNS 64


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

Puede observarse la idea geométrica de que en un extremo se tiene el paralelismo de los


gradientes en el siguiente recurso de geogebra:
https://www.geogebra.org/m/RtISr7GW#material/i7ZQsiGf
El corolario que sigue extrae algunas consecuencias geométricas de la demostración del teo-
rema del multiplicador de Lagrange.
Corolario 7.3.4 Si f restringida a una superficie S tiene un máximo o un mı́nimo en un punto
x0 de S, entonces ∇f (x0 ) es perpendicular a S en x0 .

Demostración: Si f tiene un extremo en x0 al restringirla a una superficie


S = {x ∈ Rn : g(x) = 0}, por el teorema (7.3.2) sabemos que
!
∂g ∂g
∇f (x0 ) = λ∇g(x0 ) = λ (x0 ), . . . , (x0 ) .
∂x1 ∂xn
Es decir, ∇f (x0 ) es paralelo al normal de la variedad lineal tangente a S en x0 , lo que significa
que ∇f (x0 ) es perpendicular a la superficie S en x0 . 

Estos resultados nos dicen que para determinar los extremos con restricciones de f, debemos
buscar entre los puntos x0 que satisfacen las conclusiones del teorema o del corolario. Cuando se
usa el método del teorema (7.3.2), debemos buscar un punto x0 y una constante λ de modo que
∇f (x0 ) = λ∇g(x0 ).
Veremos ahora un algoritmo para hallar efectivamente los puntos extremos del caso general
de una función f restringida a una superficie S definida por varias restricciones,


 g1 (x1 , . . . , xn ) = c1


 g2 (x1 , . . . , xn ) = c2
..




.
gn (x1 , . . . , xn ) = ck

Consideremos una función f : Rn → R y sea S = {(x1 , . . . , xn ) ∈ Rn : g(x1 , . . . , xn ) = 0}


donde g = (g1 , . . . , gm ), m < n, satisface que para cada a = (a1 , . . . , an ) ∈ S, existen variables,
digamos xi1 , . . . , xim tales que
∂(g , . . . , g )
1 m

(a) 6= 0
∂(xi , . . . , xim )
1

En este caso, el teorema (7.3.2) se puede generalizar como sigue:


Si f tiene un máximo o un mı́nimo en x0 sobre S y ∇g1 (x0 ), . . . , ∇gk (x0 ) son linealmente
independientes, entonces existen constantes λ1 , . . . , λk tales que
∇f (x0 ) = λ1 ∇g1 (x0 ) + · · · + λk ∇gk (x0 ).

Este resultado se puede demostrar generalizando el método utilizado para demostrar el teo-
rema (7.3.2) pero no lo haremos con detalle en este curso.

Entonces definimos la función F (x1 , . . . , xn , λ1 , . . . , λm ) de n + m variables como sigue


m
X
F (x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) + λi gi (x1 , . . . , xn ).
i=1

Viviana A. Dı́az - Departamento de Matemática, UNS 65


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

Nos proponemos probar que para hallar los puntos a = (a1 , . . . , an ) ∈ S, donde f |S tiene un
extremo, se tiene el siguiente algoritmo:
1. Se hallan las soluciones (a1 , . . . , an , λ1 , . . . , λm ) del sistema
m

 ∂F ∂f X ∂g


 = (a1 , . . . , an ) + λi (a1 , . . . , an ) = 0


 ∂x1 ∂x1 i=1 ∂x1
..



.




 m

 ∂F ∂f X ∂g
= (a1 , . . . , an ) + λi (a1 , . . . , an ) = 0



∂xm ∂xm ∂xm


i=1

(7.3)

∂F



= g1 (a1 , . . . , an ) = 0





 ∂λ1

 ..
.






 ∂F
= gm (a1 , . . . , an ) = 0



∂λm

Observemos que las m últimas ecuaciones son equivalentes simplemente a que (a1 , . . . , an ) ∈
S.

2. Para cada solución (a1 , . . . , an , λ1 , . . . , λm ) se hallan variables, digamos para simplificar


x1 , . . . , xm tales que
∂(g , . . . , g )
1 m

(a) 6= 0
∂(x1 , . . . , xm )

Luego, por el teorema de la función inversa, sabemos que se pueden despejar

xi = ψi (xm+1 , . . . , xn ), i = 1, 2, . . . , m

3. Se escribe el sistema

∂g1 ∂g1
(a1 , . . . , an ) dψ1 + · · · + (a1 , . . . , an ) dψm +



∂x1 ∂xm








∂g1 ∂g1



(a1 , . . . , an ) dxm+1 + · · · + (a1 , . . . , an ) dxn = 0





 ∂xm+1 ∂xn
.. ..

 . .
∂gm ∂gm


(a1 , . . . , an ) dψ1 + · · · +


 (a1 , . . . , an ) dψm +
∂x1 ∂xm










 ∂gm ∂gm
(a1 , . . . , an ) dxm+1 + · · · + (a1 , . . . , an ) dxn = 0



∂xm+1 ∂xn

y se despejan dψ1 (a), . . . , dψm (a) como combinaciones lineales de dxm+1 , . . . , dxn , digamos
∂ψ1 ∂ψ1

dψ1 (a) = (a) dxm+1 + · · · + (a) dxn





 ∂xm+1 ∂xn
..

 .
∂ψm ∂ψm


(a) dxm+1 + · · · +


 dψm (a) = (a) dxn
∂xm+1 ∂xn

Viviana A. Dı́az - Departamento de Matemática, UNS 66


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

4. Para simplificar la escritura se escribe

dxi = dψi , i = 1, 2, . . . , m

(teniendo en mente que dxi no es independiente si no que simboliza la diferencial de la


función xi = ψi (xm+1 , . . . , xn ))

5. Luego se tiene
n
∂ 2F X ∂ 2F
D2 F = 2
X
2
(a) dx i + 2 (a) dxi dxj .
i=1 ∂xi i<j ∂xi ∂xj

De acuerdo con lo anterior, como dxi = dψ1 , . . . , dxm = dψm son formas lineales en
dxm+1 , . . . , dxn , se puede escribir
n
D2 F = aii dx2i + 2
X X
aij dxi dxj
i=m+1 i<j

6. Si la forma cuadrática anterior es definida positiva, entonces f |S tiene un mı́nimo (estricto)


en (a1 , . . . , an ).
Si la forma cuadrática es definida negativa, entonces f |S tiene un máximo (estricto) en
(a1 , . . . , an ).

Demostración (de lectura optativa): En efecto, supongamos que (a1 , . . . , an , λ1 , . . . , λm )


satisface al sistema (7.3) indicado en el paso 1. Se supone que

∂(g , . . . , g )
1 m
(a) 6= 0,


∂(x1 , . . . , xm )

luego xi = ψi (xm+1 , . . . , xn ), i = 1, 2, . . . , m, resuelve el sistema gi (x1 , . . . , xn ) = 0, 1 ≤ i ≤ m.


Se tiene que la diferencial de la función compuesta, haciendo xi ≡ ψi y dxi = dψi , está dada
por
n n
X ∂f X ∂F
df (a) = (a)dxi = (a)dxi = dF (a) = 0,
i=1 ∂xi i=1 ∂xi

puesto que para x ∈ S vale que F (x) ≡ f (x).


Por otro lado, la igualdad dF (a) = 0 es consecuencia del sistema (7.3) del paso 1. En efecto,
 
n n m
X ∂F X ∂f X ∂gj 
df (a) = (a)dxi =  (a) + λj (a) dxi = 0.
i=1 ∂xi i=1 ∂xi j=1 ∂xi

Luego, a es punto crı́tico de F y, luego, es punto crı́tico de f en S.


Finalmente, como f |S = F |S , se tiene (siempre teniendo en cuenta que dψi = dxi , d2 ψi = d2 xi
para 1 ≤ i ≤ m) que la diferencial de la función compuesta f (ψ1 , ψ2 , . . . , ψm , xm+1 , . . . , xn ) ≡
F (ψ1 , ψ2 , . . . , ψm , xm+1 , . . . , xn ) (en S) hasta el orden 2 es
n m
2 2 ∂ 2F 2
X ∂ 2F ∂ 2F
(a)d2 ψi
X X
d f (a) = d F (a) = 2
(a)dx j + 2 (a)dx i dx j + 2
j=m+1 ∂xj i<j ∂xi ∂xj i=1 ∂xi

Viviana A. Dı́az - Departamento de Matemática, UNS 67


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

∂F
pero como (a) = 0, resulta
∂xi
n
!2
2 2
X ∂ 2F 2
X ∂ 2F ∂ ∂
d f (a) = d F (a) = 2
(a)(dx i ) +2 (a)dx i dx j = dx 1 + · · · + dx n F (a).
i=1 ∂xi i<j ∂xi ∂xj ∂x1 ∂xn

Luego, reemplazando en la expresión anterior dxi = dψi , i = 1, . . . , m, resulta una forma cuadráti-
ca en dxm+1 , . . . , dxn .
Si el signo de esta forma cuadrática es positivo, f |S tiene un mı́nimo; y si es negativo, f |S
tiene un máximo.
Solo resta ver la recı́proca, es decir, si a = (a1 , . . . , an ) es un punto crı́tico de f |S entonces
existen λ1 , . . . , λm tales que (a1 , . . . , an , λ1 , . . . , λm ) satisfacen el sistema (7.3) del paso 1.
Es claro que (a1 , . . . , an ) satisface las últimas ecuaciones del sistema (7.3) por hipótesis. Solo
resta ver que el sistema lineal en λ1 , . . . , λm de las n > m primeras ecuacione es compatible. Eso
es ası́ por el siguiente resultado de álgebra lineal:
Sean αi : Rn → R funcionales lineales para 1 ≤ i ≤ m donde m < n y supongamos que una
funcional lineal h : Rn → R tiene la siguiente propiedad: Si x ∈ Rn satisface αi (x) = 0, i =
1, . . . , m, entonces h(x) = 0.
Bajo estas condiciones se prueba que existen λ1 , . . . , λm ∈ R tales que h = λ1 α1 + · · · + λm αm .
Aceptando esto, se ve que en nuestro caso dg1 (a), dg2 (a), . . . , dgm (a) m son funcionales
lineales de Rn en R.
Como
 sabemos, la ecuación de la variedad lineal tangente a S en a es
∂g 1 ∂g1
(a)(x − a ) + · · · + (a)(xn − an ) = 0


 1 1
 ∂x1 ∂xn



..
 .
∂g ∂g

m m

(a)(x1 − a1 ) + · · · + (a)(xn − an ) = 0



∂x1 ∂xn

Si x(t) = (x1 (t), . . . , xn (t)) es una curva tal que x(0) = a y g1 (x(t)) = 0, . . . , gm (x(t)) = 0 (o
sea, si la curva está contenida en S) entonces derivando vale, para t = 0, que

∂g1 ∂g1
(a)x˙1 + · · · + (a)x˙n = dg1 = 0



∂x1 ∂xn



..

. (7.4)

∂gm ∂gm


(a)x˙1 + · · · +


 (a)x˙n = dgm = 0
∂x1 ∂xn

y además, como f (x(t)) tiene un punto crı́tico en t = 0, vale en a = x(0)

∂f ∂f
df = (a)x˙1 + · · · + (a)x˙n = 0 (7.5)
∂x1 ∂xn
En resumen, ẋ(0) es un vector tangente a una curva contenida en S si y solo si satisface (7.4)
y esto implica que se satisface (7.5). Es decir, si las funcionales dg1 (a), . . . , dgm (a) se anulan en
x, entonces la funcional df (a) se anula en x. Luego, por el resultado de álgebra lineal, existen
λ1 , . . . , λn tales que df + λ1 dg1 + · · · + λm dgm = 0.

Viviana A. Dı́az - Departamento de Matemática, UNS 68


CAPÍTULO 7. EXTREMOS DE FUNCIONES DE VARIAS VARIABLES

La consideración de d2 F y d2 f se hace como antes. El argumento se basa en la observación de


que F |S = f |S , luego teniendo siempre en cuenta que dxi = dψi , i = 1, . . . , m es una combinación
lineal de dxm+1 , . . . , dxn , resulta que
!2
∂ ∂
d2 F = dx1 + · · · + dxn F (a) ≡
∂x1 ∂xn
!2
∂ ∂ ∂ ∂
≡ dψ1 + · · · + dψm + dxm+1 + · · · + dxn f (a)
∂x1 ∂xm ∂xm+1 ∂xn
es una forma cuadrática en dxm+1 , . . . , dxn . 
Por lo tanto, queda establecido el método de los multiplicadores de Lagrange.

Enfatizaremos una vez más que pese a la introducción de las variables extras λ1 , . . . , λm , en la
práctica de los cálculos usar el método de los multiplicadores resulta más conveniente en muchos
casos.
Es claro que si se dispone de una parametrización sencilla del conjunto S definido por las
condiciones g1 = 0, . . . , gm = 0, entonces quizás no convenga aplicar el método de Lagrange. Tal
vez simplemente pueda considerarse la composición de la función f con la parametrización de S
y hallar los extremos de esa composición sin pensar en un caso de extremos restringidos.

Viviana A. Dı́az - Departamento de Matemática, UNS 69


Capı́tulo 8

Integrales múltiples

8.1. Integrales en el plano


Comenzaremos por definir integrales para funciones con dominio en algún subconjunto D ⊂
2
R . Nos vamos a encontrar con dificultades propias de los dominios de este tipo. Para comenzar
es bueno entender el caso más simple, en el que el dominio es un rectángulo.

8.1.1. Rectángulos y particiones


El análogo en el plano de un intervalo real es un rectángulo, que puede escribirse siempre
como el producto cartesiano de dos intervalos, digamos R = [a, b] × [c, d] que es equivalente a
decir X = (x, y) ∈ R ⊂ R2 con x ∈ [a, b] e y ∈ [c, d].

La medida o área de R es el producto de las longitudes de los lados, que denotaremos µ. Es


decir, µ(R) = (b − a)(d − c) ∈ R+ .
El diámetro del rectángulo R, que se nota δ(R), es la mayor distancia entre dos de los
puntos del rectángulo, o equivalentemente, la longitud de la diagonal del rectángulo.

El hecho a rescatar de esta definición es que si (x, y) ∈ R, entonces kx − yk ≤ δ(R).

70
CAPÍTULO 8. INTEGRALES MÚLTIPLES

Si tenemos una función f (x, y) definida en R, podemos preguntarnos cuál es el sentido de


calcular la integral de f en R. La respuesta es simple si pensamos en el gráfico de f, que es un
subconjunto de R3 . Si suponemos que f ≥ 0, por ahora, entonces la integral de f representa el
volumen de la figura formada por el rectángulo R en el plano z = 0 del “piso” y el gráfico de f
como “techo”.

Por ejemplo, si f (x, y) = 1, obtenemos un “paralelepı́pedo” (ladrillo) de base R y altura 1,


cuyo volumen es V = 1.(b − a)(d − c). En general, si f (x, y) = k con k ≥ 0, obtenemos que la
figura es un ladrillo de base R y altura k, por lo que su volumen es V = k(b − a)(d − c).

A continuación, vamos a definir las sumas superiores e inferiores de una función de dos
variables en forma análoga a como hicimos con una variable real.
Dado un rectángulo R, podemos siempre subdividirlo en una cantidad finita de rectángulos
más pequeños, es decir R = ∪i Ri donde los Ri son rectángulos (disjuntos salvo las fronteras) del
plano, como se ve en la siguiente figura:

Esto es lo que denominamos una partición P del rectángulo R, y en general lo notamos


como P = {Ri }.
Un refinamiento P0 de la partición P es otra partición que descompone cada uno de los
rectángulos Ri en una unión (disjunta salvo las fronteras) de Ri = ∪j Rij de nuevos rectángulos

Viviana A. Dı́az - Departamento de Matemática, UNS 71


CAPÍTULO 8. INTEGRALES MÚLTIPLES

más pequeños, de manera que ahora R = ∪i,j Rij .

El diámetro de una partición P que se nota δ(P ) (también llamado norma de la par-
tición y denotado kP k) es el máximo de los diámetros de todos los rectángulos que forman
la partición. Es una medida de que tan pequeños son los rectángulos de la partición: a menor
diámetro, más pequeños los rectángulos de la partición.
Observemos que dada una partición cualquiera P del rectángulo original R, y un número
positivo ε, siempre podemos obtener un refinamiento P0 de P de manera tal que δ(P0 ) < ε.

8.1.2. Integral de Riemann


Definición 8.1.1 Sea una función positiva y acotada f : R → R (es decir, f > 0 y f (R) un
conjunto acotado), y una particion P = ∪i Ri del rectángulo dominio R, entonces
X
1. La suma superior de f en la partición P se define como S(f, P ) = Mi µ(Ri ),
i
donde Mi es el supremo de f en el rectángulo Ri .
X
2. La suma inferior de f en la partición P es definida por I(f, P ) = mi µ(Ri ), donde
i
mi indica el ı́nfimo de f en el rectángulo Ri .
Con las definiciones anteriores, si M = sup(f ) en R y m = inf (f ) en R, entonces para
cualquier partición P = ∪i Ri del rectángulo R se tiene que
m ≤ mi ≤ Mi ≤ M,
para todo i, donde mi = inf (f ) en el rectángulo Ri y Mi = sup(f ) en Ri . Entonces se tiene
I(f, P ) ≤ S(f, P )
para cualquier partición P.
Como en el caso de una variable, es fácil ver que las sumas superiores decrecen a medida que
la partición se refina (pues el supremo en un conjunto más pequeño es menor o igual que en el
conjunto más grande), y también es fácil análogamente ver que las sumas inferiores crecen.
También se deduce que dado un par arbitrario P, Q de particiones, vale que
I(f, P ) ≤ S(f, Q).
Por lo tanto, las sumas inferiores están acotadas superiormente y entonces se prueba que estas
cantidades tienen un supremo que denotaremos I∗ (f ), y que llamaremos la integral inferior de
Riemann.
Análogamente, al ı́nfimo de las sumas superiores lo denotaremos I ∗ (f ) y llamaremos la inte-
gral superior de Riemann.
Evidentemente, se tiene que
I∗ (f ) ≤ I ∗ (f ).

Viviana A. Dı́az - Departamento de Matemática, UNS 72


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Definición 8.1.2 Cuando las integrales superior e inferior de Riemann coinciden, decimos que
f es Riemann integrable ZZen el rectángulo
Z R. A esta cantidad igual a la suma inferior o superior
de Riemann, la denotamos f o f , y la llamamos integral doble de f sobre R.
R R

8.1.3. Dominios generales.

Dada una función f que está definida en un dominio D ⊂ R2 acotado, pero que no es
necesariamente un rectángulo, consideramos la siguiente función auxiliar f definida como sigue.
Se toma un rectángulo cualquiera R tal que D ⊂ R y se define
(
f (X), si X ∈ D
f (X) =
0, si X ∈ R − D

Se definen las sumas superiores e inferiores de f como las sumas superiores e inferiores de f ,
y decimos que f es integrable en D si f es integrable en R.

Definición 8.1.3 Se define la integral de Riemann de f en el dominio D como la integral


de f en R, es decir, Z Z
f := f .
D R

Observación: Esta integral no depende del rectángulo elegido, por que si cambiamos el
rectángulo por otro que contenga a R, en la diferencia de ambos rectángulos la función f es nula.
En principio, hemos definido las sumas superior e inferior y, por lo tanto, la integral de
Riemann, solo para funciones positivas pero dada cualquier función acotada f definida en un
dominio acotado D, podemos considerar sus partes positiva y negativa dadas por
( (
f (X), si f (X) > 0 −f (X), si f (X) < 0
f+ (X) = y f− (X) = .
0, si f (X) ≤ 0 0, si f (X) ≥ 0

Ambas son funciones positivas para las que puede verse si son integrables Riemann y, entonces,
f es integrable Riemann en D si f+ y f− lo son. Como f = f+ − f− , vale que
Z Z Z
f= f+ − f−
D D D

Observemos que el procedimiento es análogo al caso de una variable, en el que |f | = f+ + f− .


En este punto, una pregunta clave es como saber si la función extendida f es integrable o no
en un rectángulo que continen al dominio D. Dicho de otra manera, ¿cómo sabemos si dada una
función definida en un dominio que no es un rectángulo, la función es integrable o no?
El siguiente teorema da un criterio para afirmar si una función integrable que es análogo al
de una variable.

Viviana A. Dı́az - Departamento de Matemática, UNS 73


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Teorema 8.1.4 Sea D ⊂ R2 un conjunto acotado. Entonces f : D → R es integrable (Riemann)


en D si y solo si para todo ε > 0 existe una partición P de un rectángulo que contenga a D tal
que
S(f, P ) − I(f, P ) < ε.

Demostración: Como ejercicio.

Para poder afirmar si una función de dos variables es integrable en un cierto dominio, este
criterio nos obliga a hallar una partición de algún rectángulo que contenga el dominio de la
función que cumpla esa condición para las sumas superior e inferior, cosa que puede resultar
complicada en el caso de una función y un dominio cualquiera.
Nuestro próximo objetivo es probar un teorema que da condiciones suficientes para afirmar
la integrabilidad de una función en un dominio del plano cuyas condiciones son de verificación
más práctica. Para ello, analicemos en primer lugar cuál es el problema que surge al extender la
función f a la función f definida en un rectángulo que contiene al dominio D de f .
El problema que surge de la construcción es que la función extendida f ya no es continua en
R aunque lo sea en D, pues en la frontera de D tenemos un “salto”, aún en el caso en el que f
sea constante, como se observa en la siguiente figura

La observación importante es que ∂D es el único lugar donde la función no es continua, pues


fuera de la frontera de D la función es continua por ser constante.
Para convencernos de que la función f es integrable en el rectángulo R, nos alcanzarı́a con
ver que la región ∂D no aporta nada a la integral en el rectángulo R.
En el caso general, esto no es necesariamente cierto. Sin embargo, bajo ciertas condiciones
razonables, como por ejemplo si la curva ∂D se obtiene como unión finita de gráficos de funciones
continuas, se puede integrar con tranquilidad.
La idea es cubrir el borde con rectángulos, como se ve en la figura siguiente, de manera que la
suma de las áreas de estos rectángulos sea arbitrariamente pequeña. Veamos que esto es posible.

Viviana A. Dı́az - Departamento de Matemática, UNS 74


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Proposición 8.1.5 Sea ϕ : [a, b] → R una función continua. Entonces dado ε > 0, existe
2
X conjunto finito de rectángulos Ri ⊂ R de manera que graf (ϕ) ⊂ Int(∪i Ri ), y ademas
un
µ(Ri ) = ε.
i

Demostración: Para simplificar los cálculos pero sin pérdida de generalidad, supongamos
que I = [0, 1].
Por ser ϕ continua en I, dado ε > 0, existe δ > 0 tal que |x−x0 | < δ implica |ϕ(x)−ϕ(x0 )| < 2ε .
Tomamos m ∈ N tal que m1 < δ, y particionamos el intervalo [0, 1] en m intervalos de igual
longitud m1 . En cada intervalo las imágenes de ϕ están contenidas en una banda de altura 2ε ,
como indica la figura:

Formamos los rectángulos Ri de base m1 y altura 2ε de manera que graf (ϕ) ⊂ ∪i Ri . Como
hay m rectángulos y cada uno de ellos tiene área = b.h = m1 . 2ε , se tiene que
X 1 ε ε
µ(Ri ) = m = .
i m 2 2

Como los rectángulos Ri son disjuntos, a menos de sus fronteras, puede suceder que el graf (ϕ)
pase exactamente por el vértice de dos rectángulos contiguos (en la forma que muestra la figura
siguiente) y entonces no esté totalmente contenido en el interior de la unión de los rectángulos
Ri ya que, al tomar la unión y luego el interior, ese punto queda sin cubrir.

Entonces, cubrimos esos puntos con rectángulos adicionales como muestra la figura que sigue.

Viviana A. Dı́az - Departamento de Matemática, UNS 75


CAPÍTULO 8. INTEGRALES MÚLTIPLES

De estos puntos conflictivos, hay a lo sumo m + 1. Cubrimos cada uno de ellos con un
1
rectángulo de base m+1 y altura 2ε , lo agregamos a la unión de rectángulos y entonces se tiene
que Gr(ϕ) ⊂ Int(∪i Ri ).
Por otro lado, las suma de las áreas de los primeros rectángulos da 2ε , mientras que la suma
de los rectángulos nuevos a lo sumo es
1 ε ε
(m + 1)b.h = (m + 1) = .
(m + 1) 2 2

Ası́, la suma total del área de los rectángulos que contienen al gráfico de ϕ es ε. 
Recordemos que f integrable en un dominio D quiere decir que si consideramos un rectángulo
que incluya al dominio D y extendemos el dominio de f al rectángulo con valor 0 fuera de D,
entonces f es integrable en el rectángulo.
Entonces, como consecuencia de la proposición anterior, se tiene el siguiente teorema.

Teorema 8.1.6 (de la condición suficiente de integrabilidad) Sea D ⊂ R2 un conjunto


compacto y f : D → R una función continua. Si ∂D está formada por una unión finita de gráficas
de funciones continuas, entonces f es integrable en D.

Demostración: Tomamos un rectángulo cualquiera R tal que D ⊂ R, y extendemos a f por


cero en R − D. Sea ε > 0. Queremos ver que existe una partición P de R tal que

S(f, P ) − I(f, P ) < ε.

Como f es continua en D, alcanza un valor máximo y su mı́nimo en D, y en R − D la función


vale 0, por lo que pueden considerarse el valor máximo y mı́nimo de la función f en R. Sea
s = max(f ) − min(f ) (s > 0 si f 6= 0 en R).
R R
Cubrimos primero la frontera de D con un número finito de rectángulos {Ri }i∈A , de manera
que
X ε
µ(Ri ) = .
i∈A 2s
Como f es continua en R − Int(∪i Ri ) (pues las únicas discontinuidades de f están en ∂D ⊂
ε
Int(∪i Ri )), vale que dado ε0 = > 0, para X, Y ∈ (R − Int(∪i Ri )), existe δ > 0 tal que
2µ(R)

kX − Y k < δ ⇒ kf (X) − f (Y )k < ε0 .

Tomamos ahora una partición P = {Ri }i∈F de R que contenga a los rectángulos {Ri }i∈A que
cubren la frontera de D (estamos subdividiendo aquellos rectángulos que estaban superpuestos
para pensarlos como rectángulos disjuntos), como muestra la figura:

Viviana A. Dı́az - Departamento de Matemática, UNS 76


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Es decir, P = (∪i∈A Ri )∪(∪i∈F −A Ri ), donde el primer conjunto de la unión cubre a la frontera


de D y el segundo al resto de R. Refinando suficientemente la partición P , podemos suponer que
la partición tiene diámetro δP < δ. Entonces
X X X
S(f, P ) − I(f, P ) = (Mi − mi )µ(Ri ) = (Mi − mi )µ(Ri ) + (Mi − mi )µ(Ri ) <
i∈F i∈A i∈F −A

ε ε ε
ε0 .µ(Ri ) ≤ s + ε0 µ(R) = +
X X
< s.µ(Ri ) + µ(R) = ε. 
i∈A i∈F −A 2s 2 2µ(R)

8.2. Integrales iteradas y teorema de Fubini


En general puede ser muy complicado calcular integrales múltiples usando la definición. Sin
embargo, el siguiente teorema nos dice que, bajo ciertas condiciones bastante generales, el cálculo
se reduce al cálculo sucesivo de integrales en una variable, donde podemos aplicar los métodos
que conocemos.
Estas integrales se conocen como integrales iteradas.

Teorema 8.2.1 (de Fubini) Si R = [a, b] × [c, d] es un rectángulo en R2 , y f : R → R es una


función integrable en R, notamos fx (y) = f (x, y) = fy (x) y tomamos

I(x) = I∗ (fx ) = sup{I(fx , P ) : P partición de [c, d]},

S(x) = I ∗ (fx ) = inf {S(fx , P ) : P partición de [c, d]}.


Entonces vale que I, S son funciones integrables en [a, b] y además
Z Z b Z b
f= S(x) dx = I(x) dx.
R a a

Vale el resultado análogo para fy .

Demostración: Consideremos una partición P del rectángulo, donde ∆i = [xi , xi+1 ] es una
partición de [a, b] y ∆0j = [yj , yj+1 ] es una partición de [c, d], de manera que los rectángulos
Rij = ∆i × ∆0j de área (xi+1 − xi )(yi+1 − yi ) forman la partición P del rectángulo original. Como
antes, abusamos un poquito de la notación y usamos ∆ para denotar al intervalo y a su longitud.
Entonces  

mij (f )∆i ∆0j = mij (f )∆0  ∆i ,


X X X
I(f, P ) = 
j
i,j i j

Viviana A. Dı́az - Departamento de Matemática, UNS 77


CAPÍTULO 8. INTEGRALES MÚLTIPLES

donde mij (f ) indica el ı́nfimo de f en Rij . Si x ∈ Rij , entonces mj (fx ) (el ı́nfimo de fx en ∆0j ) es
mayor o igual que el ı́nfimo de f en Rij , pues

mj (fx ) = inf {f (x, y) : x fijo, y ∈ ∆0j },

y el ı́nfimo en un subconjunto -en este caso {x} × ∆0j - siempre es mayor o igual que el ı́nfimo en
el conjunto original -en este caso ∆i × ∆0j . Se deduce que, cualquiera sea x ∈ ∆i ,

mij (f )∆0j ≤ mj (fx )∆0j ≤ I∗ (fx ) = I(x).


X X

j j

Si en el extremo derecho tomamos el ı́nfimo para x ∈ ∆i - que anotamos mi (I)-, multiplicamos


por ∆i y sumamos, se deduce que
 

mij (f )∆0  ∆i
X X X
I(f, P ) = 
j ≤ mi (I)∆i ≤ I∗ (I),
i j i

es decir
I(f, P ) ≤ I∗ (I).
Con un razonamiento análogo se deduce que I ∗ (I) ≤ S(f, P ). Luego, como I∗ (I) ≤ I ∗ (I), se
obtiene la cadena
I(f, P ) ≤ I∗ (I) ≤ I ∗ (I) ≤ S(f, P ).
Como f es integrable, los extremos se pueden hacer tan próximos como querramos refinando la
partición P, y en consecuencia debe ser
Z Z b

f = I∗ (I) = I (I) = I(x) dx,
R a

lo que prueba que I es integrable en [a, b], con integral igual a la integral doble de f .
La prueba para la integral de S es idéntica y la omitimos, lo mismo vale para las afirmaciones
respecto de fy . 

Corolario 8.2.2 Si f : R ⊂ R2 → R es continua, entonces f es integrable y además


Z Z Z b Z d ! Z d Z b !
f= f (x, y) dy dx = f (x, y) dx dy.
R a c c a

Demostracion. Como ejercicio.

Otra aplicación útil la obtenemos combinando el teorema de la condición suficiente de inte-


grabilidad con el Teorema de Fubini, observando las siguientes figuras en el plano:

Viviana A. Dı́az - Departamento de Matemática, UNS 78


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Corolario 8.2.3 1. Sea D ⊂ R2 un conjunto compacto que se puede escribir como

{(x, y) ∈ R2 : ϕ1 (x) ≤ y ≤ ϕ2 (x), x ∈ [a, b]}.

Supongamos que f : D → R es continua, y las ϕi son continuas. Entonces


Z Z Z b Z y=ϕ2 (x) !
f= f (x, y) dy dx.
D a y=ϕ1 (x)

2. Sea D ⊂ R2 un conjunto compacto que se puede escribir como

{(x, y) ∈ R2 : ψ1 (y) ≤ x ≤ ψ2 (y), y ∈ [c, d]}.

Supongamos que f : D → R es continua, y las ψi son continuas. Entonces


Z Z Z d Z x=ψ2 (y) !
f= f (x, y) dx dy.
D c x=ψ1 (y)

Demostración: Como ejercicio.

8.3. Integrales en el espacio


Veamos ahora el caso de integrales de funciones con dominio en R3 . Aquı́ el análogo de un
rectángulo es un “ladrillo”, que seguiremos llamando R por comodidad.

Viviana A. Dı́az - Departamento de Matemática, UNS 79


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Su medida es el volumen µ(R) = (b − a)(d − c)(f − e), y su diámetro δ(R) el largo de la


diagonal mayor del ladrillo.
Una partición P de R es una subdivisión de R en ladrillos disjuntos Pi como en la figura
que sigue

Un refinamiento P 0 de P es una subdivisión de cada uno de los ladrillos Pi = ∪i,j Pji . El


diámetro δ(P ) de la partición es el diámetro del ladrillo más grande que la conforma.
¿Qué significará entonces la integral de una función con dominio en R3 ?
En principio, esperamos que la integral de la función f (x, y, z) = 1 nos devuelva la medida
o volumen del cubo que es V olumen = 1(b − a)(d − c)(f − e), aunque no podamos visualizar el
gráfico de f.
La integral triple se define usando particiones de manera análoga al caso n = 2, y cuando
existe la integral de f en el ladrillo R, ésta se denomina integral triple, y se denota
Z Z Z Z
f o f.
R R

Lo que es más interesante es pensar qué ocurre cuando el dominio no es un ladrillo en R3 .


Con razonamientos similares a los del plano, se puede probar lo siguiente:
Teorema 8.3.1 Sea D ⊂ R3 un conjunto compacto, y f : D → R una función continua. Si
∂D esta formado por una unión finita de gráficos de funciones continuas definidas en conjuntos
compactos del plano, entonces f es integrable en D.

Aquı́ las superficies reemplazan a las curvas como frontera de la región, y la idea central es
que una superficie en R3 , que es gráfica de una función continua en un compacto, tiene volumen
nulo y, por lo tanto, la frontera de la región no influye en la existencia de la integral.
Respecto del cálculo, en el caso de dominios de R3 hay más posibilidades que en el caso de R2 ,
simplemente por ser tres las variables. Las distintas posibilidades se observan en las siguientes
figuras.

Viviana A. Dı́az - Departamento de Matemática, UNS 80


CAPÍTULO 8. INTEGRALES MÚLTIPLES

En el primer caso, se trata de de la región encerrada por los gráficos de funciones fi (x, y),
cuyo dominio común A se indica como una sombra en el plano xy. En los otros casos se tienen
las variantes obvias.

8.4. Integrales en Rn

En general, para cualquier n ≥ 1, un rectángulo R es el producto cartesiano de n intervalos


R = [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ],
su medida es el producto µ(R) = (b1 − a1 )(b2 − a2 ) . . . (bn − an ), y su diámetro δ(R) es la
longitud de la diagonal mayor, es decir, la mayor distancia posible entre dos puntos de R.
El siguiente es un corolario inmediato del Teorema de Fubini:
Corolario 8.4.1 Si R = [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ] es un rectángulo en Rn y f : R → R es
una función continua en R, entonces
Z Z bn Z b2 Z b1
f= ... f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn
R an a2 a1

donde la integración se puede efectuar en cualquier orden.

Demostración: Hay que observar que si f es continua, entonces es continua en cada una de
sus variables por separado, y entonces cada
Z bi
f (x1 , x2 , . . . , xn ) dxi
ai

existe y es una función continua en [ai , bi ], en particular integrable. Usando el teorema de Fubini
repetidas veces se obtiene el corolario. 

8.4.1. Medida de una región


Definición 8.4.2 Definimos la medida de una región D ⊂ Rn , y decimos que D es medible, si
la funcion f = 1 es integrable en D, y en ese caso la medida de D se calcula como
Z
µ(D) = 1.
D

Si existe, en el plano esta integral nos devuelve la superficie de la región D, mientras que en
el espacio nos devuelve el volumen de la regiónn D.
¿Podemos dar condiciones para que esta integral exista? Sı́, es sencillo en este momento, pues
la función 1 es continua y, por lo tanto, se tiene el siguiente resultado.
Teorema 8.4.3 Sea D ⊂ Rn compacto, f : D → R continua, y supongamos que ∂D esta
formado por una unión finita de gráficos de funciones Zϕ : Ki ⊂ Rn−1 → R continuas, con Ki
compactos. Entonces f es integrable en D, y además f se puede calcular con n integrales
D
iteradas.
En particular, D es medible y
Z
µ(Rj∗ ).
X X
µ(D) = 1 = sup µ(Ri ) = inf
D
(∪Ri )⊂D D⊂(∪Rj∗ )

Viviana A. Dı́az - Departamento de Matemática, UNS 81


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Demostración: Lo único que resta probar sonZ las últimas igualdades que dan µ(D) y son
consecuencia del siguiente hecho: para calcular 1 tomamos un rectángulo R que contenga a
D
D, extendemos a la función como cero en R − D. Es decir, f = 1 en D y f = 0 en R − D. Luego,
particionamos R = ∪i Ri .

Si Ri es un rectángulo ı́ntegramente contenido en D (como el que indicamos con R1 en


la figura), entonces allı́ la integral inferior de f vale siempre 1, por lo tanto estos rectángulos
aportan a la integral. Mientras que si el rectángulo toca el exterior de D (o sea no está contenido
totalmente en D, como los que señalamos ˜como R2 y R3 en la figura), entonces allı́ el ı́nfimo de
f es cero y estos no aportan a la integral inferior.
En cambio para la integral superior aportan todos los rectángulos que tocan D pues en ellos
el supremo de f es 1. 

8.5. Cambio de variables en el plano


8.5.1. Particiones generales

Para calcular integrales dobles, dado un dominio D ⊂ R2 con una frontera “buena”, lo que
hacemos es incluir el dominio D en un rectángulo de lados paralelos a los ejes y tomar una
partición de él. Sin embargo, la elección de estos rectángulos de lados paralelos a los ejes es, en
cierta medida, arbitraria. Podemos tomar paralelogramos, es decir, figuras de lados paralelos dos
a dos, y considerar una partición como indica la figura:

Puede probarse que existe la integral de f en D usando rectángulos paralelos a los ejes si y
sólo si existe la integral usando estos paralelogramos. La idea de por qué vale esto es la siguiente:
dado un rectángulo R de lados paralelos a los ejes, puede tomarse una partición del mismo usando
paralelogramos, que aproxime tanto como uno quiera al rectángulo R. Recı́procamente, dado un
paralelogramo R0 , se lo puede aproximar tanto como uno quiera usando rectángulos de lados
paralelos a los ejes.

Viviana A. Dı́az - Departamento de Matemática, UNS 82


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Z
Vamos a usar este hecho: si f es integrable en D, entonces su integral f se puede calcular
D
considerando una familia o partición de paralelogramos Ri0 de un paralelogramo R0 que contenga
a la región D.

8.5.2. Transformaciones lineales

Dados dos vectores linealmente independientes en el plano, su imagen por una transformación
lineal T : R2 → R2 son otros dos vectores linealmente independientes. Entonces todo rectángulo
(o mejor dicho, todo paralelogramo) va a parar a otro paralelogramo.
Veamos la relación entre las áreas de un rectángulo R∗ y su imagen R = T (R∗ ) por una
transformación lineal T.

Proposición 8.5.1 Si T : R2 → R2 es una transformación lineal inversible y R∗ es un rectángu-


lo de lados paralelos a los ejes, entonces el área del paralelogramo R = T (R∗ ) que se obtiene como
la imagen de R∗ por T es
µ(R) = µ(T (R∗ )) = |det(T )| µ(R∗ ).

Demostración: Dado que una traslación no modifica el área de un rectángulo, podemos


suponer que el rectángulo R∗ tiene uno de sus vértices en el origen, como indica la figura

Supongamos como en el dibujo que los lados de R∗ miden exactamente A y B. !


a b
Si la transformación lineal está dada en la base canónica por la matriz T = , entonces
c d
se tiene
T (A, 0) = T (A(1, 0)) = A.T (1, 0) = A(a, c) = (Aa, Ac) y
T (0, B) = B.T (0, 1) = B(b, d) = (Bb, Bd).
Entonces el rectángulo R∗ va a parar al paralelogramo R = T (R∗ ) que está generado por T (A, 0)
y T (0, B).
Ahora recordemos que dados dos vectores → −
v ,→

w ∈ R3 , el área del parelelogramo determinado
por →−
v y → −w se puede calcular como el módulo del producto vectorial entre → −
v y →

w , es decir,


AREA = k v × w k.→

Consideremos ahora el paralelogramo imagen R = T (R∗ ) en el espacio R3 pero sobre el plano
XY como indica la figura que sigue.

Viviana A. Dı́az - Departamento de Matemática, UNS 83


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Entonces los vectores →



v y→

w son simplemente →

v = (Aa, Ac, 0), y →

w = (Bb, Bd, 0). Luego,
el área de R = T (R∗ ) es
 
i j k
k→

v ×→



wk = Aa  = k(0, 0, AaBd, AcBb)k = |AB||ad − bc| = µ(R )|det(T )| 
Ac 0


Bb Bd 0

Pero entonces, dada cualquier figura D∗ ⊂ R2 que sea medible, si D = T (D∗ ) indica la imagen
de D∗ por una transformación lineal T inversible, podemos cubrir D∗ con rectángulos Ri∗ que
aproximen la figura, y ası́ estaremos llenando D = T (D∗ ) con paralelogramos Ri = T (Ri∗ ) que
aproximan esa figura, como en el dibujo que sigue:

En consecuencia, µ(D) = µ(T (D∗ )) = |det(T )|µ(D∗ ). En efecto,

µ(T (D∗ )) = lı́m µ(T (Ri∗ )) = lı́m |det(T )|µ(Ri∗ ) = |det(T )| µ(D∗ ).
X X X
µ(Ri ) = lı́m

Esta misma idea se puede aplicar para calcular integrales.

8.5.3. Cambio de variables, versión lineal

Observemos en la siguiente figura, que si f : R2 → R está definida en D = T (D∗ ), entonces


f ◦ T está definida en D∗ :

Viviana A. Dı́az - Departamento de Matemática, UNS 84


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Teorema 8.5.2 Versión lineal del cambio de variable. Si D∗ ⊂ R2 , T : R2 → R2 es una


transformación lineal inversible y f : D = T (D∗ ) → R es integrable, entonces
Z Z
f= (f ◦ T ) |det(T )|.
D D∗

Demostración: Tomamos Ri∗ rectángulos que aproximen D∗ , de manera que Ri = T (Ri∗ )


aproximen D = T (D∗ ). Entonces, si pi ∈ Ri , se puede escribir pi = T (qi ) con qi ∈ Ri∗ , luego
Z
(f ◦ T )(qi ) µ(T (Ri∗ )) =
X X
f = lı́m f (pi ) µ(Ri ) = lı́m
T (D∗ ) δ(Ri )→0
i
δ(Ri )→0
i
Z
|det(T )|(f ◦ T )(qi ) µ(Ri∗ ) =
X
= lı́m (f ◦ T ) |det(T )|. 
δ(Ri )→0
i D∗

8.5.4. Cambio de variables, versión general

Obsevemos la analogı́a en la fórmula del Teorema (8.5.2) con la fórmula del método de
sustitución para integrales en R.
Recordemos que si f es una función continua en un intervalo cerrado I ⊂ R, y g es una función
C 1 en [a, b] tal que se puede hacer la composición f ◦ g en [a, b], entonces h(x) = f (g(x))g 0 (x) es
una función integrable y además
Z b Z g(b)
f (g(x))g 0 (x) dx = f (u) du = F (g(b)) − F (g(a)) (8.1)
a g(a)

si F es una primitiva de f .
En este caso de una variable, |det(T )| juega el papel de g 0 .
Por ahora este teorema (8.5.2) tiene utilidad limitada. Lo que queremos es extender el re-
sultado a funciones inyectivas cuya diferencial sea inversible salvo un conjunto “muy peque˜no”
(con medida nula). Es decir, dado un dominio D∗ y una función T : R2 → R2 inyectiva, queremos
hallar primero la relación entre µ(D∗ ) y µ(T (D∗ )) = µ(D), y luego ver cuál es la relación entre
la integral de f en un dominio D∗ y la de f ◦ T en el otro dominio T (D∗ ).

Viviana A. Dı́az - Departamento de Matemática, UNS 85


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Si T es una función inyectiva, el dominio D = T (D∗ ) se puede pensar cubierto con las
imágenes de los rectángulos que cubren D∗ , es decir si ∪i Ri∗ aproximan D∗ entonces ∪i T (Ri∗ )
aproximan D = T (D∗ ). ¿Cómo calcular la medida de cada T (Ri∗ )? En principio es un problema
difı́cil, ya que T no es lineal y cada Ri = T (Ri∗ ) está deformado de manera similiar a la que
muestra la figura:

La idea entonces es la siguiente.


Podemos escribir, dado Pi ∈ R2 , una expresión aproximada de T utilizando la fórmula de
Taylor
T (X) = T (Pi ) + DT (Pi )X + O(X),
donde O(X) es simplemente el resto correspondiente al término lineal. Esta afirmación es impre-
cisa y luego haremos una demostración formal, pero por ahora pensemos que T se puede escribir
ası́.
Tenemos como hipótesis que DT es inversible (pues T es inyectiva), salvo tal vez un conjunto
de medida nula. Entonces podemos imaginar que, como el primer término es sólo un desplaza-
miento por un vector fijo T (Pi ) ∈ R2 que no modifica el área y O(X) es suficientemente pequeño
como para no aportar nada al área, entonces para un rectángulo pequeño Ri∗ con vértice en Pi ,
vale que
µ(T (Ri∗ )) ≈ µ(DT (Pi )Ri∗ ) = |det(DT (Pi ))| µ(Ri∗ ).
Siguiendo con esta lı́nea de pensamiento, se tendrı́a para un dominio D∗ y un conjunto de
rectángulos Ri∗ que aproximen D∗ que

µ(T (D∗ )) = µ(T (Ri∗ )) ≈ µ(DT (Pi )Ri∗ ) = |det(DT (Pi ))| µ(Ri∗ )
X X X
lı́m

lı́m

lı́m

δ(Ri )→0 δ(Ri )→0 δ(Ri )→0
i i i
Z
= |det(DT | , es decir
D∗
Z

µ(D) = µ(T (D )) = |det(DT )|.
D∗

Mientras que si f : D = T (D∗ ) → R es integrable, con un razonamiento análogo también se


tendrı́a Z Z Z
f= f= (f ◦ T ) |det(DT )|.
D T (D∗ ) D∗

Viviana A. Dı́az - Departamento de Matemática, UNS 86


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Definición 8.5.3 Llamaremos a JT := |det(DT )| el determinante Jacobiano de la función


T.

Pasemos ahora a la demostración del teorema.


Teorema 8.5.4 Sea T : R2 → R2 una función inyectiva y de clase C 1 . Sea D∗ ⊂ R2 un
conjunto acotado y f : D = T (D∗ ) → R una función integrable. Si DT es inversible en D∗ y
JT = |det(DT )|, entonces Z Z
f= (f ◦ T ) JT.
D D∗

Demostración: Basta probar que, dado un punto p ∈ D∗ , existe un entorno R∗ de p donde


vale el teorema, es decir Z Z
f= (f ◦ T ) JT.
T (R∗ ) R∗
En efecto, si existe ese entorno entonces dividiendo D∗ en un conjunto finito de entornos Ri∗
donde vale el teorema y sumando las integrales, se tiene el resultado del teorema en el conjunto
total D∗ .
Para probar la existencia de ese entorno para cada punto de D∗ , descompondremos la función
T : R2 → R2 como la composición de dos funciones con imagen en R y usaremos la fórmula de
sustitución en una variable en cada una de las funciones.
Sea p ∈ D∗ y T (x, y) = (t1 (x, y), t2 (x, y)).
Supongamos primero que DT (p) = I2 . En particular, ∇t1 (p) = (1, 0).
Si en D∗ definimos H(x, y) := (t1 (x, y), y), H es una función C 1 y también se tiene DH(p) =
I2 , ya que  
∂t1 ∂t1
DH =  ∂x ∂y  .
 
0 1

∂t ∂t1 ∂t1 ∂t1
1
Observemos que JH = |det(DH)| = = , pues como (p) = 1 y es una función
∂x ∂x ∂x ∂x
∂t1
continua (ya que T es C1 ), podemos suponer que estamos en un entorno donde es positiva.
∂x
∂t1
Es decir, tenemos JH = .
∂x
Como DH(p) = I2 , por el teorema de la función inversa existe un entorno U (que vamos a
suponer que es un rectángulo abierto) de p donde H es inversible. Ahora definimos en un entorno
de H(p) la función K(x, y) := (x, t2 (H −1 (x, y))) y tenemos la situación que grafica la figura
siguiente.

Viviana A. Dı́az - Departamento de Matemática, UNS 87


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Reemplazando se ve que K ◦ H = (t1 (x, y), t2 (x, y)) = T.


Observemos que DT = DKH ◦ DH, donde por DKH queremos decir la diferencial de K
evaluada en H(X). Luego det(DT ) = det(DKH ) det(DH), por lo que

JT = JKH .JH.

Tomemos un conjunto W ∗ ⊂ U alrededor de p y una función g integrable en W ∗ . Podemos


suponer que W ∗ es suficientemente pequeño para que se pueda tomar un rectángulo R∗ = [a, b] ×
[c, d] ⊂ U que contenga a W ∗ , y extendemos la función g como cero en R∗ −W ∗ como es habitual.
Entonces, por el Teorema de Fubini,
Z Z Z
g= g(u, v) dudv,
H(W ∗ ) [c,d] Iv

donde Iv es el intervalo dado por la imagen de [a, b] via g1 (u, v) con v ∈ [c, d] fijo, según indica
la figura (pues H fija [c, d]):

Ahora hacemos la sustitución u = uv (x) = t1 (x, v). Derivando respecto de x se tiene


∂t1
du = (x, v) dx
∂x
y cuando x recorre [a, b], u recorre Iv . Entonces
Z Z
∂t1
g(u, v) du = g(t1 (x, v), v) (x, v) dx,
Iv [a,b] ∂x
y tenemos Z Z Z
∂t1 Z
g= g(t1 (x, v), v) (x, v) dxdv = (g ◦ H) JH.
H(W ∗ ) [c,d] [a,b] ∂x W∗

Con una cuenta análoga se tiene, para cualquier entorno abierto V ∗ de H(P ) suficientemente
pequeño, Z Z
f= (f ◦ K)JK.
K(V ∗ ) V∗

Luego Z Z Z
f= f= (f ◦ K)JK.
T (R∗ ) K◦H(R∗ ) H(R∗ )
Z Z
Llamando g = (f ◦ K) JK y usando que g= (g ◦ H) JH se deduce que
H(W ∗ ) W∗
Z Z
(f ◦ K) JK = (f ◦ K ◦ H) JKH JH.
H(R∗ ) R∗

Viviana A. Dı́az - Departamento de Matemática, UNS 88


CAPÍTULO 8. INTEGRALES MÚLTIPLES

Como DT (X) = DKH(X) DH(X), tomando determinante a ambos miembros se tiene que
JKH .JH = JT (donde ahora con JKH notamos al Jacobiano de K, evaluado en H) y juntando
las últimas dos ecuaciones se tiene
Z Z
f= (f ◦ T ) JT.
T (R∗ ) R∗

Por último, si DT (p) 6= I2 , basta llamar A = DT (p) que es una transformación lineal inver-
sible, y definiendo T := A−1 ◦ T se tiene
Z Z Z
f= f= (f ◦ A) |det(A)|,
T (R∗ ) A◦T (R∗ ) T (R∗ )

usando el resultado para transformaciones lineales con A.


Si aplicamos a la función T (que sı́ verifica DT (P ) = I2 ) lo que probamos para el caso en que
la diferencial de la función en el punto p es la identidad, se tiene entonces que
Z Z Z
(f ◦ A) |det(A)| = (f ◦ A ◦ A−1 ◦ T ) JT |det(A)| = (f ◦ T ) JT
T (R∗ ) R∗ R∗

pues JT = |det(A−1 )|.|det(T )| = |det(A)|−1 JT. 

8.6. Cambio de variables en el espacio

Para el espacio, se tiene un resultado análogo al anterior.


En primer lugar, no es difı́cil probar que si R∗ es un paralelogramo sólido en R3 y T es una
transformación lineal inversible, entonces R = T (R∗ ) es otro paralelogramo sólido y además
µ(R) = |det(T )| µ(R∗ ).
Con este resultado, se tiene un enunciado equivalente al del Teorema (8.5.2) con una demos-
tración análoga.
Teorema 8.6.1 (del cambio de variables). Si D∗ ⊂ R3 y T : R3 → R3 es una transforma-
cion lineal inversible, entonces si D∗ es medible, D = T (D∗ ) es medible y además
µ(D) = |det(T )| µ(D∗ ).

Finalmente, usando las mismas ideas que antes, toda función inyectiva T : R3 → R3 con
diferencial inversible nos permite hacer un cambio de variable que transforma una integral en D∗
en una integral en D = T (D∗ ) de la siguiente manera.
Teorema 8.6.2 Sea T : R3 → R3 una función inyectiva y de clase C 1 . Sea D∗ ⊂ R3 un
conjunto acotado y una función f : D = T (D∗ ) → R integrable. Si DT es inversible en D∗ y
JT = |det(DT )|, entonces Z Z
f= (f ◦ T ) JT.
D D∗

La demostración usa las mismas ideas que el caso n = 2 y la omitimos. El único comentario a
tener en cuenta es que ahora hay que descomponer T como una aplicación que primero depende
de dos variables y después de una, y usar el resultado que ya tenemos para dos variables. Es
decir, es un resultado general que se prueba por inducción sobre el número de variables.

Viviana A. Dı́az - Departamento de Matemática, UNS 89


Capı́tulo 9

Integrales curvilı́neas

9.1. Orientación de curvas


Definición 9.1.1 Una curva en Rn es una función x = f (t) = (f1 (t), . . . , fn (t)), t ∈ [a, b], con
f 0 (t) continua tal que f 0 (t) 6= 0, para todo t ∈ [a, b]. A la ecuación x = f (t) se la llama una
parametrización de la curva x.

Proposición 9.1.2 Sean x = f (t), t ∈ [a, b], una curva en Rn , C = f ([a, b]) ⊆ Rn la imagen de
x y x = g(u), u ∈ [c, d], otra parametrización de C, tal que f y g son inyectivas. Entonces existe
una correspondencia biunı́voca entre los parámetros t y u dada por f (t) = g(u) ∈ C. O sea, se
tiene la función t = ϕ(u), ϕ : [c, d] → [a, b] tal que f (ϕ(u)) = g(u).
Más aún, resulta que ϕ tiene derivada continua.

Demostración: Como f 0 (t0 ) 6= 0 para t0 ∈ [a, b], resulta que fi0 (t0 ) 6= 0 para algún i =
1, 2, . . . , n. Entonces, por el teorema de la función inversa, la función xi = fi (t) tiene inversa en
un entorno de x0i = fi (t0 ), digamos t = hi (xi ), la cual tiene derivada continua en un entorno de
x0i . Ahora xi = gi (u), luego t = hi (gi (u)) = ϕ(u).
Como hi , gi tienen derivadas continuas, lo mismo sucede con t = ϕ(u). Además, observemos
que como fi (ϕ(u)) = gi (u), resulta ϕ(u0 ) = t0 , fi0 (t0 ).ϕ0 (u0 ) = gi0 (u0 ). Luego gi0 (u0 ) 6= 0, ya que
ϕ0 (u0 ) 6= 0. 

Ahora concentrémonos en el cambio de parámetro de u a t dado por ϕ. Pueden darse dos


casos, ϕ0 (u) > 0 o ϕ0 (u) < 0. Geométricamente, esto corresponde a la noción de sentido de
recorrido.

Definición 9.1.3 Si ϕ0 (u) > 0, se dice que ambas parametrizaciones f y g recorren la curva
C en el mismo sentido. Si ϕ0 (u) < 0, se dice que las parametrizaciones f y g recorren C en
sentido contrario.

9.2. Integrales de lı́nea

Definición 9.2.1 Llamaremos un arco de curva regular o curva regular a una curva
f : (a, b) → U ⊂ Rn siendo U un conjunto abierto y f una función inyectiva.

90
CAPÍTULO 9. INTEGRALES CURVILÍNEAS

También llamaremos curva regular “con borde” a una función f : [a, b] → Rn que es la
restricción de una función f : (a − ε, b + ε) → Rn con derivada continua f 0 (t) y con f 0 (t) 6= 0
para t ∈ (a, b).

Definición 9.2.2 Una curva continua f : (a, b) → Rn se dice regular a trozos si existe una
partición a = t0 < t1 < t2 < . . . < tn = b tal que f (ti−1 , ti ) es regular para 1 ≤ i ≤ n. Es decir,
el conjunto C ⊆ Rn se descompone en trozos C = C1 ∪ C2 ∪ . . . ∪ Cq ∪ . . . , de manera que cada
trozo Ci es parametrizable con una curva f (i) : [ai , bi ] → Ci ⊆ Rn y f (i) (bi ) = f (i+1) (ai+1 ) como
muestra la figura siguiente.

Definición 9.2.3 Se llaman integrales curvilı́neas de la función g : Rn → R a lo largo de


una curva f a las integrales del tipo
Z b
g(f (t))fi0 (t) dt, 1 ≤ i ≤ n,
a

o sumas de ellas.

Proposición 9.2.4 Si f : U → Rn y h : V → Rn son dos parametrizaciones continuas con igual


sentido de recorrido de la misma curva en Rn y g : Rn → R una función. Entonces, las integrales
de g a lo largo de f son iguales a las correspondientes integrales de g a lo largo de h. Es decir,
Z b Z d
g(f (t))fi0 (t) dt = g(h(u))h0i (u) du.
a c

Demostración: En efecto, mediante la fórmula de cambio de variable se tiene


Z b Z d Z d
g(f (t)fi0 (t) dt = g(f (ϕ(u)))fi0 (ϕ(u))ϕ0 (u) du = g(h(u))h0i (u) du. 
a c c

Observación: Es importante observar que si se cambia el sentido de recorrido mediante una


reparametrización u = ϕ(t) con ϕ0 (t) < 0, la integral curvilı́nea cambia de signo.
En efecto, si ϕ(a) = d y ϕ(b) = c, como ϕ0 < 0, se tiene que c < d. Si h(u), u ∈ [c, d], es la
otra parametrización distinta de f (t), resulta
Z d Z b Z b
g(h(u))h0i (u) du = g(h(ϕ(t)))h0i (ϕ(t))ϕ0 (t) dt = − g(f (t))fi0 (t) dt.
c a a

A veces es útil adoptar una notación más ágil para indicar las integrales curvilı́neas.

Viviana A. Dı́az - Departamento de Matemática, UNS 91


CAPÍTULO 9. INTEGRALES CURVILÍNEAS

Z b Z
En lugar de escribir g(f (t))fi0 (t) dt se escribe simplemente g(x) dxi , donde C = f (a, b)
a C
es la imagen de f , teniendo en cuenta que xi = fi (t) y luego dxi = fi0 (t) dt.
Además, si C es la curva dada por la parametrización f (t), entonces −C es el mismo conjunto
de puntos descriptos por una parametrización h(u), donde u = ϕ(t) con ϕ0 < 0. Se tiene ası́ que
Z Z
g(x) dxi = − g(x) dxi .
C −C

El hecho de que las integrales curvilı́neas a lo largo de una curva no cambien cuando se cambia
la parametrización (sin cambiar el sentido de recorrido) justifica en parte esta notación, ya que
C puede ser parametrizada de distinto modo siempre que si ϕ es la relación entre los parámetros,
vale que ϕ0 > 0.

Definición 9.2.5 Si C = C1 ∪ . . . ∪ Cq ⊆ U es una curva regular a trozos, se define la inte-


gral curvilı́nea de g : U → Rm a lo largo de C, simplemente como la suma de las integrales
curvilı́neas a lo largo de los trozos Ci , 1 ≤ i ≤ n, es decir,
Z q Z
X
g(x) dxi = g(x) dxi .
C j=1 Ci

Proposición 9.2.6 Sean U ⊂ Rn un conjunto abierto, f : U → R una función y x(t) =


(x1 (t), . . . , xn (t)), t ∈ [a, b], una curva C ⊆ U. Entonces
Z
∂f ∂f
dx1 + . . . + dxn = f (x(b)) − f (x(a)).
C ∂x1 ∂xn

Demostración: Por definición, se tiene que


Z b !
Z
∂f ∂f ∂f ∂f
dx1 + . . . + dxn = (x(t))x01 (t) + . . . + (x(t))x0n (t) dt =
C ∂x1 ∂xn a ∂x1 ∂xn
Z b
df (x(t))
= dt = f (x(b)) − f (x(a)).
a dt
Si C es regular a trozos, se aplica este resultado a cada trozo y se suma. 
Es decir, en particular, la integral curvilı́nea solo depende de los extremos x(a) y x(b) de C
y no del resto de la curva. Por lo tanto, si dos curvas C, C tienen los mismos extremos entonces
la integral curvilı́nea de lo mismo para C que para C.
Análogamente, si C es regular a trozos, vale una propiedad similar.

Corolario 9.2.7 Si C es una curva dada por la parametrización x = x(t), t ∈ [a, b], con x(a) =
x(b) (es decir, C es cerrada), entonces
Z
∂f ∂f
dx1 + . . . + dxn = 0.
C ∂x1 ∂xn

Viviana A. Dı́az - Departamento de Matemática, UNS 92


CAPÍTULO 9. INTEGRALES CURVILÍNEAS

Demostración: Inmediata de la proposición anterior.

Observación: La condición
Z
f1 dx1 + . . . + fn dxn = 0, ∀ C cerrada (9.1)
C

equivale a la condición conocida como de independencia del camino.


Sean C1 , C2 curvas que unen dos puntos P, Q ∈ U de manera que los sentidos de recorrido
de C1 y C2 son tales que el origen de C1 y C2 es P mientras que el extremo de C1 y C2 es Q,
como en la figura que sigue.

Entonces, vale que


Z Z
f1 dx1 + . . . + fn dxn = f1 dx1 + . . . + fn dxn . (9.2)
C1 C2

La equivalencia entre las ecuaciones (9.1) y (9.2) está dada por el hecho de que si C1 , C2 son
como se ha indicado, entonces C = C1 + (−C2 ) es una curva cerrada.
Recı́procamente, toda curva cerrada C se descompone en dos trozos como se ha indicado.

Vamos a demostrar ahora la recı́proca de la Proposición 9.2.6.

Proposición 9.2.8 Sea U ⊂ Rn un conjunto abierto y arco-conexo. Supongamos que las fun-
ciones continuas P1 (x), . . . , Pn (x) tienen la propiedad de que si dos curvas regulares a trozos
C : x = x(t), t ∈ [a, b], C : x = x(t), t ∈ [a, b] tienen los mismos extremos x(a) = A =
x(a), x(b) = B = x(b), entonces
Z Z
P1 (x) dx1 + . . . + Pn (x) dxn = P1 (x) dx1 + . . . + Pn (x) dxn .
C C

∂f
Entonces existe una función f : U → R tal que Pi (x) = (x) para todo x ∈ U. En particular
∂xi
Df es continua.

Demostración: Consideremos el punto A ∈ U extremo de las curvas. El hecho de que U


sea arco-conexo significa, por definición, que dado un punto cualquiera z ∈ U , existe una curva
C : x(t), t ∈ [a, b], C ⊂ U tal que x(a) = A, x(b) = z. Entonces vamos a definir f : U → R
como sigue:
Z Z b
f (z) := P1 (x) dx1 + . . . + Pn (x) dxn = (P1 (x(t))x01 (t) + . . . + Pn (x(t))x0n (t)) dt,
C a

siendo C ⊂ U una curva cualquiera que une A con z.

Viviana A. Dı́az - Departamento de Matemática, UNS 93


CAPÍTULO 9. INTEGRALES CURVILÍNEAS

El hecho de que la integral no dependa del camino que une A con z, nos dice que f está bien
definida.
Como U es abierto y z ∈ U, hay un entorno de z, digamos B(r, z) ⊂ U. Dado i = 1, 2, ..., n,
consideremos el vector hi = (0, 0, ..., ∆, ..., 0) donde las componentes de hi son todas nulas excepto
la i-ésima que vale ∆ < r. Entonces se puede “alargar” la curva C que une A con z, agregando
un segmento en la dirección del eje i-ésimo, definiendo la curva C dada por x : [a, b + ∆] → U
como sigue (
x(t), si t ∈ [a, b]
x(t) =
z + (t − b)hi , si t ∈ [b, b + ∆]
que resulta regular a trozos. Se tiene
Z Z b+∆
f (z + hi ) = P1 (x) dx1 + . . . + Pn (x) dxn = (P1 (x(t))x01 (t) + . . . + Pn (x(t))x0n (t)) dt =
C a
Z b
= (P1 (x(t))x01 (t) + . . . + Pn (x(t))x0n (t)) dt+
a
Z b+∆
+ (P1 (z + (t − b)hi )x01 (t) + . . . + Pn (z + (t − b)hi )x0n (t)) dt.
b
Luego,

f (z + hi ) − f (z) 1 Z b+∆
= (P1 (z + (t − b)hi )x01 (t) + . . . + Pn (z + (t − b)hi )x0n (t)) dt.
∆ ∆ b
Como x0i (t) = hi y x0j = 0 si j 6= i, resulta

f (z + hi ) − f (z) Z b+∆
= Pi (z + (t − b)ei ) dt.
∆ b

Pasando al lı́mite para ∆ → 0, se tiene


∂f
(z) = Pi (z). 
∂xi

Observación: Se puede ver que los resultados de las proposiciones 9.2.6 y 9.2.8 valen igual-
mente aunque los trozos Ci de la curva no cumplan la condición x0 6= 0.

Corolario 9.2.9 Sean P1 (x), . . . , Pn (x) funciones continuas Pi : U → R con U ⊂ Rn un con-


junto arco-conexo. Entonces la condición necesaria y suficiente para que exista f : U → R tal
que
∂f
= Pi , para 1 ≤ i ≤ n,
∂xi
es que, para toda curva C cerrada y regular a trozos, valga
n
Z X
Pi dxi = 0.
C i=1

Demostración: Como ejercicio.

Viviana A. Dı́az - Departamento de Matemática, UNS 94


Capı́tulo 10

Integrales de superficie

10.1. Orientación de superficies


Definición 10.1.1 Una superficie regular es una función inyectiva f : U → Rn siendo U ⊂
R2 un conjunto abierto conexo, tal que Df es continua y Car(Df (u)) = 2 para todo u ∈ U.

Nota: La caracterı́stica de una matriz A de orden n × m es el número entero k = Car(A),


definido por la siguiente condición: existe un menor de A de orden k no nulo, y no existe ningún
menor de A de orden k + l, con l ≥ 1, no nulo.
El hecho de que la caracterı́stica de Df (u) sea 2 para todo u ∈ U , implica que la dimensión
de la imagen (para cada u) de la transformación lineal Df (u) : R2 → Rn es 2. En particular, si
n = 3, esa condición garantiza que la imagen (la superficie) tenga plano tangente en R3 .

Sean f : U → Rn y g : V → Rn dos parametrizaciones biyectivas de la misma superficie


S = f (u) = g(v), donde U, V ⊂ R2 son conjuntos abiertos y acotados. Asumimos que Df, Dg
son continuas y de caracterı́stica 2.
Si f y g son inyectivas, entonces existe ϕ : U → V tal que f = g ◦ ϕ. En la práctica, esto
significa que si se plantea el sistema


 x1 = f1 (t1 , t2 ) = g1 (s1 , s2 )


 x2 = f2 (t1 , t2 ) = g2 (s1 , s2 )
 ...



xn = fn (t1 , t2 ) = gn (s1 , s2 )

se pueden despejar (s1 , s2 ) = ϕ(t1 , t2 ) y (t1 , t2 ) = ϕ−1 (s1 , s2 ) de dos de estas ecuaciones debido a
que Car(Df ) = 2.
∂(f , f )
i j
En efecto, dado (t1 , t2 ) ∈ U, sucede que algún Jacobiano (t1 , t2 ) 6= 0. Luego, en un

∂(t1 , t2 )
entorno de (xi , xj ) = (fi (t1 , t2 ), fj (t1 , t2 )) ∈ R2 se pueden despejar (por el teorema
de la función
∂(t , t )
1 2
inversa) (t1 , t2 ) = ψ(xi , xj ) = (ψ1 (xi , xj ), ψ2 (xi , xj )) con Jacobiano 6= 0 (probar como

∂(xi , xj )
ejercicio).
Luego, como xi = gi (s1 , s2 ), se tiene que

(t1 , t2 ) = (ψ1 (gi (s1 , s2 ), gj (s1 , s2 )), ψ2 (gi (s1 , s2 ), gj (s1 , s2 ))) = ϕ−1 (s1 , s2 ) = (ϕ−1 −1
1 (s1 , s2 ), ϕ2 (s1 , s2 ))

95
CAPÍTULO 10. INTEGRALES DE SUPERFICIE

lo que da la relación entre los parámetros.

Esto conduce a definir la siguiente noción de orientación para superficies.


Definición 10.1.2 Se dice que dos parametrizaciones f y g inducen la misma orientación
en la superficie S, si el Jacobiano de ϕ es positivo, es decir, si

∂(t , t )
1 2
Jϕ = det(Dϕ) =
> 0.
∂(xi , xj )

Las parametrizaciones f y g inducen orientaciones contrarias en la superficie S si el


Jacobiano de ϕ es negativo, es decir,

∂(t , t )
1 2
Jϕ = det(Dϕ) =
< 0.
∂(xi , xj )

Observación: Al dar una parametrización, es necesario indicar el orden en que se consideran


los parámetros. Un cambio de orden en los parámetros conduce a un cambio de orientación.
Notación: Si S se considera parametrizada con f (o con cualquier otra parametrización
relacionada con f por una ϕ con Jacobiano positivo), entonces escribiremos −S para indicar que
consideramos una parametrización de S relacionada con la f por una ϕ con Jacobiano negativo.

Para más dimensiones, la situación es similar.


Sean f : U → Rn y g : V → Rn dos parametrizaciones de una misma (hiper)superficie
S = f (U ) = g(V ) ⊂ Rn donde U, V son conjuntos abiertos arco-conexos de Rm y f, g son
funciones inyectivas tales que Df, Dg son continuas y de caracterı́stica m.
En esta situación, para saber si f, g inducen la misma orientación o no, se procede de la
siguiente manera.
Se halla
(cómo se pueda!) un punto t = (t1 , . . . , tm ) ∈ U tal que, para
ciertos ı́ndices i1 , ..., im
∂(f , . . . , f ) ∂(f , . . . , f )
i1 im 1 m
se tenga
(t) 6= 0. Para simplificar, supongamos que

(t) 6= 0.
∂(t1 , . . . , tm ) ∂(t1 , . . . , tm )

Se encuentra (cómo se pueda!) el punto s = (s1 , . . . , sm ) ∈ V tal que xi = fi (t) = gi (s), para
i = 1, ..., m.

∂(f1 , . . . , fm ) ∂(g1 , . . . , gm )
Se calculan (t) y (s). Luego,
∂(t1 , . . . , tm ) ∂(s1 , . . . , sm )

∂(g , . . . , g )
1 m

(s)
∂(t , . . . , t )
1 m
∂(s1 , . . . , sm )
(s) = ∂(f , . . . , f ) .


∂(s1 , . . . , sm ) 1 m
(t)


∂(t1 , . . . , tm )

Viviana A. Dı́az - Departamento de Matemática, UNS 96


CAPÍTULO 10. INTEGRALES DE SUPERFICIE


∂(t , . . . , t )
1 m
Si
(s) > 0, entonces f y g inducen la misma orientación en S y, si no, inducen
∂(s1 , . . . , sm )

orientaciones contrarias.

10.2. Orientabilidad de superficies


Definición 10.2.1 Se dice que una superficie regular S ⊆ Rn es orientable si S se puede
descomponer en trozos abiertos Si tal que S = S1 ∪ S2 ∪ . . . ∪ Sq donde cada trozo Si admite una
parametrización fi : Ui → Si donde Ui ⊆ Rm es un abierto conexo, y tal que en las intersecciones
Si ∩ Sj las dos parametrizaciones fi , fj induzcan la misma orientación.
La idea intuitiva es que una superficie es orientable si se puede decidir sin ambigüedad cuál es
cada uno de los lados de la superficie. Los vectores normales nos ayudan a precisar esta noción.
Una definición equivalente para el caso n = 3 es la siguiente.
Una superficie S en el espacio se dice orientable si admite un campo continuo de vectores
normales, es decir, si existe una función continua →

n : S → R3 que asigna a cada punto q ∈ S


un vector no nulo (unitario) n (q) normal a la superficie S en el punto q.
La continuidad de → −
n es esencial para asegurar que dichos vectores normales determinan uno
de los “lados” de la superficie. El “otro lado” estará asociado al campo continuo de vectores
normales −→−n (q).

Definición 10.2.2 Una superficie regular con borde es la restricción de una superficie re-
gular f : U → Rn , f |D a una zona D ⊂ U, donde D es cerrada y la frontera de D es una curva
regular a trozos. Luego f |∂D es una curva regular a trozos en Rn .
Definición 10.2.3 Una superficie regular a trozos es un conjunto de superficies regulares
(i)
con borde f (i) : D → Rn , con i = 1, 2, 3, . . . , “pegadas por su borde”. Esto significa que
(i) (j) (i) (j)
f (i) (∂D ) ∩ f (j) (∂D ) = f (i) (D ) ∩ f (j) (D )
en donde estas intersecciones son también curvas regulares a trozos. Se nota
(i) (i)
S (i) = f (i) (D ) y ∂S (i) = f (i) (∂D ).

Por ejemplo, la superficie de un cono es regular a trozos siendo sus caras trozos regulares
pegados por sus bordes. La superficie de una esfera, se descompone como la reunión de dos
casquetes pegados por sus bordes (ecuador).

Viviana A. Dı́az - Departamento de Matemática, UNS 97


CAPÍTULO 10. INTEGRALES DE SUPERFICIE

Dada una superficie regular con borde f : D → Rn , si el borde de D se parametriza de modo


que quede recorrido en sentido positivo (“antihorario” en R2 ), entonces el borde de f (D) queda
parametrizado también con un cierto sentido de recorrido.
Si f (i) = S (i) es la imagen de una superficie regular con borde y la colección f (1) , f (2) , . . . , f (q)
es una superficie regular a trozos, entonces escribiremos S = S (1) + . . . + S (q) y hablaremos
(informalmente) de la “superficie” S y sus “trozos regulares” S (1) , . . . , S (q) .

Definición 10.2.4 Una superficie regular a trozos S = S (1) + . . . + S (q) es orientable si sus
trozos S (i) se pueden orientar (es decir, se pueden reparametrizar) de modo que la orientación
inducida en los bordes sea “coherente”, esto es que cada borde esté “recorrido en sentido contrario
para cada trozo”.

Se puede ver que dada una zona V ⊂ R3 con borde ∂V , el borde (que se supone una superficie
regular a trozos ∂V = S1 + . . . + Sq ) tiene una orientación positiva “natural”. Esto es análogo a
dar una orientación positiva del borde ∂A de una zona plana, el que es una curva. La orientación
positiva “natural” está orientada positivamente, si el par (t, n) formado por el vector tangente
t y la normal interior →−
n está orientado positivamente. La manera de establecer la orientación
positiva de ∂V es la siguiente.

Definición 10.2.5 Una parametrización del trozo Si , digamos f (i) : D → Si ⊆ R3 , D ⊆ R2


es positiva si la terna (fu , fv , →

n e ) está orientada positivamente. Es decir, si el determinante de
la matriz cuyas columnas son fu(i) , fv(i) , → n e es positivo, es decir, det(fu(i) , fv(i) , →
− −
n e ) > 0 donde

−n es la normal exterior a Si (por convención).

Observación: Notar que fu , fv son tangentes a Si .

10.3. Integral de superficie


Vamos ahora a definir integral de superficie.

Definición 10.3.1 Sea f : D → Rn una superficie. Sea S = f (D) con la orientación inducida
por la parametrización f. Sea P : Rn → R una función de n variables dada y sean i, j ∈
(1, ..., n). Entonces la integral de superficie de la función P sobre la superficie S, que se nota
Z
P (x1 , ..., xn ) dxi dxj , se define como
S

Z Z
∂(xi , xj )
P (x1 , ..., xn ) dxi dxj = P (f (u, v)) dudv.
S D ∂(u, v)

Si S = S1 +S2 +...+Sq , donde los trozos Si son regulares y parametrizados con Si : f (i) : Di → Rn
coherentemente por los f (i) (para lo que S debe ser orientable!), entonces se define
Z Z Z Z
P dxi dxj = P dxi dxj + P dxi dxj + . . . + P dxi dxj .
S S1 S2 Sq

También se llaman integrales de superficie, a sumas de integrales del tipo anterior.

Viviana A. Dı́az - Departamento de Matemática, UNS 98


CAPÍTULO 10. INTEGRALES DE SUPERFICIE

Nota: A los efectos del cálculo de integrales, es irrelevante que se considere o no el borde ya
que éste tiene medida nula.

Proposición 10.3.2 Si f y h son dos parametrizaciones de una superficie S, regular o regular a


trozos, relacionadas por una reparametrización ϕ con Jacobiano positivo, entonces las integrales
de superficie calculadas con una u otra parametrización coinciden. Si en cambio el Jacobiano de
ϕ es negativo, la integral calculada con f es igual a la integral calculada con h, con signo opuesto.
En otros términos, Z Z
P dxi dxj = − P dxi dxj ,
S −S
donde la notación −S indica una parametrización de S relacionada con la parametrización con-
siderada en S por una ϕ de Jacobiano negativo.

Demostración: Consideremos el caso de una superficie regular S : f : D → Rn , f (u, v) ∈


Rn , (u, v) ∈ D, una parametrización ϕ(t, s) = (u, v) y sea h(t, s) = f (ϕ(t, s)), (t, s) ∈ ϕ−1 (D).
∂(u, v)
Por la fórmula del cambio de variable se tiene, si > 0, que
∂(t, s)
Z Z
∂(x1 , x2 ) Z
∂(x1 , x2 ) ∂(u, v)
P dx1 dx2 = P (f (u, v)) dudv = P (f (ϕ(t, s))) . dtds =
S D ∂(u, v) −1
ϕ (D) ∂(u, v) ∂(t, s)
Z
∂(x1 , x2 )
= P (h(t, s)) dtds.
ϕ−1 (D) ∂(t, s)
∂(u, v)
En cambio, si < 0, la fórmula del cambio de variable da
∂(t, s)
Z Z
∂(x1 , x2 ) Z
∂(x1 , x2 ) ∂(u, v)
P dx1 dx2 = P (f (u, v)) dudv = − P (f (ϕ(t, s))) dtds =
S D ∂(u, v) −1
ϕ (D) ∂(u, v) ∂(t, s)
Z
∂(x1 , x2 ) Z
=− P (h(t, s)) dtds = − P dx1 dx2 .
ϕ−1 (D) ∂(t, s) −S

El caso de una S = S1 + S2 + ... + Sq se obtiene sumando las igualdades correspondientes a


cada Si . 

10.3.1. Generalización a más dimensiones


En lugar de una superficie, se puede tener una variedad (o “hipersuperficie”) dada paramétri-
camente por f : D → Rn donde ahora D ⊆ R3 es un abierto conexo, f es inyectiva y Df
es continua y de caracterı́stica 3. Restringiendo a U ⊂ D, donde U es cerrado y su frontera
(o borde) ∂U consiste de una superficie regular a trozos, se tiene la noción de una variedad
con borde regular a trozos U 3-dimensional. “ Pegando” trozos se obtienen variedades regulares
a trozos tridimensionales. Ası́ entonces se pueden definir, por un proceso análogo, variedades
4-dimensionales regulares a trozos, y en general, inductivamente, m-dimensionales regulares a
trozos.
Si S es una tal variedad regular f : D → Rn , D ⊆ Rm se define para P : Rn → R la integral
Z Z
∂(x1 , . . . , xn )
P (x1 , . . . , xn ) dx1 . . . dxn = P (f (u1 , . . . , um )) du1 . . . dum .
S D ∂(u1 , . . . , um

Viviana A. Dı́az - Departamento de Matemática, UNS 99


CAPÍTULO 10. INTEGRALES DE SUPERFICIE

Se tienen fórmulas, como en el caso de superficies


Z Z Z
P dx1 . . . dxn = − P dx1 . . . dxn = − P dx2 dx1 . . . dxn . . .
S −S −S

donde el significado de −S es como sigue.


Si S se parametriza de dos maneras distintas mediante, digamos f : D → Rn y g : E → Rn y
f, g están relacionados por ϕ (cambio de parámetros), entonces si el Jacobiano det(ϕ) es mayor
que 0, da lo mismo, calcular la integral de P sobre S con cualquier parametrización, f ◦ h. si en
cambio, det(ϕ) < 0, hay un cambio de signo. Esto justifica la notación “S” para indicar cualquier
parametrización que este relacionada con la parametnrización f que define S por una ϕ con
Jacobiano positivo y en cambio denotar “−S” a cualquier parametrización que este relacionada
con f por una ϕ con Jacobiano negativo.

Viviana A. Dı́az - Departamento de Matemática, UNS 100


Capı́tulo 11

Campos vectoriales

Definición 11.0.1 Sea U ⊆ Rn un conjunto abierto. Un campo vectorial F en U es una


aplicación F : U → Rn (que supondremos con derivadas continuas hasta un cierto orden,
conveniente para el problema en cuestión). Es decir, que si F1 , . . . , Fn son las componentes de
n
F = (f , . . . , f ), y →

e ,...,→
− f→−
X
1 n 1 n e es la base canónica de Rn , escribimos F = e .
i i
i=1

Cada Fi es una función Fi : U → R. Consideramos a los elementos del dominio U ⊆ Rn de F


como puntos y los elementos de su imagen F (x) ∈ Rn como vectores, por lo que interpretamos
al campo F como una asignación que a cada punto x ∈ U le hace corresponder un vector F (x)
con punto inicial x, de ahı́ la idea de campo “vectorial”.
Geométricamente, se representa F (x) para cada x = (x1 , . . . , xn ) ∈ U como un vector aplicado
en x cuyas componentes están dadas por F (x).

Pueden utilizarse distintos recursos de Geogebra para graficar campos vectoriales en el plano
y campos vectoriales en el espacio.
Para observar el comportamiento de un campo vectorial como un campo de velocidades de
sus lı́neas de flujo, puede verse el siguiente video de YouTube.

Definición 11.0.2 Un campo vectorial F = (f1 , . . . , fn ) se dice conservativo si la integral del


campo a lo largo de cualquier curva cerrada es 0. Es decir, si
Z n
X
fi (x) dxi = 0
C i=1

cualquiera que sea la curva cerrada C.


Luego, como se ha visto en la Proposición 1.2.7 de la clase anterior, si un campo F definido
en un conjunto U arco-conexo es conservativo, existe una función ϕ tal que ∇ϕ = F.
Definición 11.0.3 Dado un campo vectorial F , una función ϕ tal que ∇ϕ = F se llama el
potencial (o la función potencial) del campo F .

∂ϕ
Si F = (f1 , . . . , fn ) = ∇ϕ, es decir, fi = , por la igualdad de las derivadas cruzadas,
∂xi
resulta
∂fi ∂fj
= . (11.1)
∂xj ∂xi

101
CAPÍTULO 11. CAMPOS VECTORIALES

Se tiene ası́ que (11.1) es condición necesaria para que un campo vectorial F (con condiciones
de derivabilidad adecuadas, por ejemplo, con derivadas continuas) sea una campo de gradientes,
es decir, para que exista una función ϕ tal que ∇ϕ = F.
En lo que sigue nos ocuparemos de la recı́proca.
Supongamos que, para un campo vectorial F definido en un conjunto U ⊆ Rn abierto, vale la
condición (11.1). ¿Se puede concluir de aquı́ que existe un potencial ϕ : U → R tal que ∇ϕ = F ?
La respuesta a esta pregunta es que “depende de U ”. Veamos por qué.
Comencemos con un lema que nos permitirá probar el teorema que da las condiciones sufi-
cientes para la existencia de función potencial de un campo vectorial.

Lema 11.0.4 Sea h(x, y) una función continua en [a, b] × (c, d) y supongamos además que
Z b
hy (x, y) es continua en [a, b] × (c, d). Sea ϕ(y) = h(x, y) dx. Entonces ϕ tiene derivada
Z b a
0 0 ∂h
continua ϕ (y) en (c, d) y vale que ϕ (y) = dx.
a ∂y

Demostración: Tenemos
"Z #
ϕ(y + ∆) − ϕ(y) b Z b
1 Z b
h(x, y + ∆) − h(x, y)
= h(x, y + ∆) dx − h(x, y) dx = dx.
∆ a a ∆ a ∆

h(x, y + ∆) − h(x, y)
Por el teorema del valor medio, se tiene que = hy (x, ξ). Entonces


ϕ(y + ∆) − ϕ(y) Z b Z b Z b Z b
− hy (x, y) dx = hy (x, ξ) dx − hy (x, y) dx = (hy (x, ξ) − hy (x, y)) dx


∆ a a a a

Por la continuidad de hy , haciendo ∆ → 0 (equivalentemente, ξ → y), se tiene que



ϕ(y + ∆) − ϕ(y) Z b
− hy (x, y) dx −→ 0.


∆ a ∆→0

Z b
0
Es decir, ϕ (y) − hy (x, y) dx = 0. 
a

Teorema 11.0.5 (de existencia y construcción de la función potencial).


Sea U = {x ∈ Rn :k x k< r}. Sea F = (f1 , . . . , fn ) un campo definido sobre U . Supongamos
que se cumple, cualesquiera que sean i, j = 1, 2, ..., n, que
∂fi ∂fj
(x) = (x), ∀ x ∈ U.
∂xj ∂xi
∂ϕ
Entonces, existe una función ϕ : U → R tal que F = ∇ϕ, es decir, fi = .
∂xi

Demostración: Haremos la prueba para el caso n = 2. El caso general resulta de modo


análogo.
Sea C la curva que une el punto (0, 0) con (x1 , x2 ) ∈ U, dada por los dos trozos regulares
C = C1 + C2 siguientes:

Viviana A. Dı́az - Departamento de Matemática, UNS 102


CAPÍTULO 11. CAMPOS VECTORIALES

( (
x1 = t x1 = x1
C1 : t ∈ [0, x1 ], C2 : t ∈ [0, x2 ].
x2 = 0 x2 = t
Z
Definamos ϕ : U → R mediante ϕ(x1 , x2 ) = f1 dx1 + f2 dx2 , es decir,
Z x1 Z x2 C

ϕ(x1 , x2 ) = f1 (t, 0) dt + f2 (x1 , t) dt.


0 0
∂ϕ ∂ϕ
Calculemos y en (x1 , x2 ).
∂x1 ∂x2
∂ Z x1
En primer lugar, observemos que f1 (t, 0) dt = f1 (x1 , 0),
∂x1 0
∂ Z x1 ∂ Z x2
f1 (t, 0) dt = 0 y f2 (x1 , t) dt = f2 (x1 , x2 ).
∂x2 0 ∂x2Z 0
∂ x2
Solo resta entonces hallar f2 (x1 , t) dt. Para ello, se tiene el lema 11.0.4, del que
∂x1 0
resulta que
∂ Z x2 Z x2
∂f2
f2 (x1 , t) dt = (x1 , t) dt.
∂x1 0 0 ∂x1
∂f2 ∂f2
Ahora usamos la hipótesis que supone que = y tenemos que
∂x1 ∂x2
∂ Z x2 Z x2
∂f2
f2 (x1 , t) dt = (x1 , t) dt = f1 (x1 , x2 ) − f1 (x1 , 0).
∂x1 0 0 ∂x1
Sumando todo lo anterior, se concluye que
∂ϕ ∂ϕ
(x1 , x2 ) = f1 (x1 , 0) + f1 (x1 , x2 ) − f1 (x1 , 0), es decir, (x1 , x2 ) = f1 (x1 , x2 ).
∂x1 ∂x1
∂ϕ
Además de lo anterior, también probamos que (x1 , x2 ) = f2 (x1 , x2 ).
∂x2
El caso n-dimensional es análogo. Por ejemplo, en tres dimensiones, la función ϕ es
Z x1 Z x2 Z x3
ϕ(x1 , x2 , x3 ) = f1 (t, 0, 0) dt + f2 (x1 , t, 0) dt + f3 (x1 , x2 , t) dt
0 0 0

∂ϕ
y hay que verificar que (x) = fi (x). 
∂xi

Viviana A. Dı́az - Departamento de Matemática, UNS 103


Capı́tulo 12

Teoremas integrales

12.1. Teorema de la divergencia o de Gauss

A continuación veremos el teorema de la divergencia o teorema de Gauss. Empezaremos


estudiando el caso de dimensiones bajas.
Sea U ⊆ R2 una zona que se define mediante
U = {(x1 , x2 ) : x1 ∈ [a, b], x2 ∈ [ϕ(x1 ), ψ(x1 )]}.
Suponemos ϕ(x1 ) ≤ ψ(x1 ) y además, por simplicidad (aunque no es necesario), que ϕ(a) =
ψ(a), ϕ(b) = ψ(b). Una situación como la que muestra la figura siguiente.

Orientamos la frontera de U ∂U = C = C1 + C2 positivamente, siendo


( (
x1 = t x1 = b − t
C1 : t ∈ [a, b], C2 : t ∈ [0, b − a].
x2 = ϕ(t) x2 = ψ(b − t)
Z
∂K
Sea K(x1 , x2 ) una función dada y consideremos la integral doble dx1 dx2 . Se tiene
U ∂x2
Z b Z ψ(x1 ) Z b
Z
∂K ∂K
dx1 dx2 = dx1 dx2 = dx1 [K(x1 , ψ(x1 )) − K(x1 , ϕ(x1 ))].
U ∂x2 a ϕ(x1 ) ∂x2 a

Pero Z Z b Z Z b
K dx1 = K(t, ϕ(t)) dt y K dx1 = − K(t, ψ(t)) dt.
C1 a C2 a
Luego Z
∂K Z
dx1 dx2 = − K dx1 . (12.1)
U ∂x2 C

104
CAPÍTULO 12. TEOREMAS INTEGRALES

Es decir, la integral doble se reduce a una integral curvilı́nea.


Si la zona U no puede escribirse como la zona comprendida entre dos gráficas x1 = ϕ(x1 ) y
x2 = ψ(x1 ), pero puede descomponerse en la unión de dos zonas U1 , U2 separadas por una curva
regular a trozos Q y de modo que cada zona U1 , U2 se pueda expresar como la zona comprendida
entre dos gráficas (ver siguiente figura), entonces la fórmula (12.1) sigue valiendo.

En efecto, al parametrizar el borde ∂U1 de U1 positivamente resulta ∂U1 = C1 + C2 + Q. Al


parametrizar positivamente el borde ∂U2 resulta ∂U2 = C3 − Q + C4 . Entonces se tiene que, si
U = U1 ∩ U2 ,
Z
∂K Z
∂K Z
∂K Z Z
dx1 dx2 = dx1 dx2 + dx1 dx2 = − K dx1 − K dx1 =
U ∂x2 U1 ∂x2 U2 ∂x2 C1 +C2 +Q C3 −Q+C4
Z Z
=− K dx1 = − K dx1
C1 +C2 +C3 +C4 C

siendo C = C1 + C2 + C3 + C4 el borde de U (orientado positivamente).


Por un procedimiento algo complicado, pero esencialmente equivalente en dificultad al des-
cripto, se trata el caso en que U = U1 ∩ U2 ∩ . . . ∩ Uq donde cada Ui es la zona comprendida entre
dos curvas en x2 . Podemos ası́ concluir que para una amplia clase de zonas U vale la fórmula
Z
∂K Z
dx1 dx2 = − K dx1
U ∂x2 ∂U

donde ∂U está orientado positivamente.


De modo completamente análogo, si U se descompone en zonas Ui cada una de las cuales se
describe en la forma Ui = {(x1 , x2 ) : x2 ∈ [c, d], α(x2 ) ≤ x1 ≤ β(x2 )} entonces vale, siendo ∂U el
borde de U orientado positivamente
Z
∂K Z
dx1 dx2 = − K dx2 .
U ∂x1 ∂U

∂K1 ∂K2
Sea ahora K = (K1 , K2 ) un campo vectorial. La divergencia de K es ∇.K = + ,
! ∂x1 ∂x2
Z Z
∂K1 ∂K2
entonces ∇.K dx1 dx2 = + dx1 dx2 . Aplicando lo anterior resulta
U U ∂x1 ∂x2
Z
∂K1 Z Z
∂K2 Z
dx1 dx2 = K1 dx2 y dx1 dx2 = − K2 dx1 .
U ∂x1 ∂U U ∂x2 ∂U

Viviana A. Dı́az - Departamento de Matemática, UNS 105


CAPÍTULO 12. TEOREMAS INTEGRALES

Z Z
Luego, ∇.K dx1 dx2 = −K2 dx1 + K1 dx2 y, entonces, parametrizando ∂U con la longitud
U ∂U Z L
de arco S, resulta (llamando “L” a la longitud total de ∂U ) (−K2 x01 + K1 x02 ) ds donde
0
0 dxi
x = , i = 1, 2.
ds
Ahora el vector →− n = (x02 , −x01 ). Luego −K2 x01 + K1 x02 = hK, →
n normal exterior es →
− −
n i. Por
lo tanto, resulta
Z Z
∇.K dx dx = hK, → −
1n i ds
2 (12.2)
U ∂U

La fórmula (12.2) es el resultado llamado teorema de la divergencia (o de Gauss) para el caso


n = 2.

Vamos a considerar ahora el caso n = 3. La idea básica es la misma que en el caso n = 2.


Sea U ⊆ R3 una zona tal que U = {(x1 , x2 , x3 ) : (x1 , x2 ) ∈ D, ϕ(x1 , x2 ) ≤ x3 ≤ ψ(x1 , x2 )}.
Luego, el borde ∂U = S1 + S2 se descompone en los casquetes


 x1 = v ≡ x1 (u, v)
S1 :  x2 = u ≡ x2 (u, v) (u, v) ∈ {(u, v) ∈ R2 : (v, u) ∈ D} = D

x3 = ϕ(v, u) ≡ x3 (u, v)


 x1 = u
S2 :  x2 = v (u, v) ∈ D

x3 = ψ(u, v)
donde se han parametrizado! S1 y S2 de modo positivo (es decir, si →

n es la normal exterior se
∂x ∂x →
debe tener Det , ,− n > 0).
∂u ∂v

Se tiene entonces
Z ψ(x1 ,x2 )
Z
∂K Z
∂k
dx1 dx2 dx3 = dx1 dx2 dx3 =
U ∂x3 D ϕ(x1 ,x2 ) ∂x3
Z
= [K(x1 , x2 , ψ(x1 , x2 )) − K(x1 , x2 , ϕ(x1 , x2 ))] dx1 dx2 .
D
Ahora
Z Z
∂(x1 , x2 ) Z
K dx1 dx2 = K(u, v, ψ(u, v)) dudv = K(u, v, ψ(u, v)) dudv,
S2 D ∂(u, v) D

Viviana A. Dı́az - Departamento de Matemática, UNS 106


CAPÍTULO 12. TEOREMAS INTEGRALES

Z Z
∂(x1 , x2 ) Z
K dx1 dx2 = K(v, u, ϕ(v, u)) dudv = K(v, u, ϕ(v, u))(−1) dudv =
S1 D ∂(u, v) D
Z Z
=− K(v, u, ϕ(v, u)) dudv = − K(u, v, ϕ(u, v)) dudv.
D D
Z Z
Luego, Kdx1 dx2 = [K(x1 , x2 , ψ(x1 , x2 )) − K(x1 , x2 , ϕ(x1 , x2 ))] dx1 dx2 y, por lo tanto,
S D
Z
∂K Z
dx1 dx2 dx3 = K dx1 dx2 . (12.3)
U ∂x3 ∂U

Como se ha hecho en el caso bidimensional, descomponiendo adecuadamente una zona U en


zonas más pequeñas, se puede concluir que la fórmula (12.3) vale para una amplia clase de zonas.
Además, se prueba similarmente que para estas zonas U vale que
Z
∂K Z
dx1 dx2 dx3 = K dx3 dx1
U ∂x2 ∂U

∂K ZZ
dx1 dx2 dx3 = K dx2 dx3 .
U ∂x1 ∂U

Por lo tanto, combinando estos resultados, si K = (K1 , K2 , K3 ) es un campo vectorial y


∂K1 ∂K2 ∂K3
∇.K = + + resulta
∂x1 ∂x2 ∂x3
Z Z
∇.K dx1 dx2 dx3 = [K1 dx2 dx3 + K2 dx3 dx1 + K3 dx1 dx2 ] (12.4)
U ∂U

donde ∂U se supone orientado positivamente (obsérvese también el orden de los diferenciales


dx2 dx3 , dx3 dx1 , dx1 dx2 ).
La fórmula (12.4) puede considerarse como el teorema de la divergencia. Sin embargo, lo
reescribiremos en otra forma.
Sea x = (x1 , x2 , x3 ) ∈ ∂U y sea x = x(u, v) con (u, v) ∈ D una parametrización
q de un trozo,
digamos S de ∂U tal que x ∈ S. El elemento de área ds es ds = J12 + J22 + J32 dudv donde
∂(x2 , x3 ) ∂(x3 , x1 ) ∂(x1 , x2 )
J1 = , J2 = y J3 = .
∂(u, v) ∂(u, v) ∂(u, v)
Por otra parte, como se supone que la parametrización x = x(u, v) es positiva, ocurre que, si

− →
− J1 →

e 1 + J2 →−
e 2 + J3 →−
e3
n es la normal exterior, vale que n = q . Luego,
J12 + J22 + J32
hK, →

n i ds = (KZ1 J1 + K2 J2 + K3 J3 ) dudv y entonces
Z Z
hK, →
−n i ds = (K J + K J + K J ) dudv = K dx dx + K dx dx + K dx dx .
1 1 2 2 3 3 1 2 3 2 3 1 3 1 2
S D S
Por lo tanto, como la integral sobre ∂U se hace sumando integrales sobre trozos, resulta
Z Z
K1 dx2 dx3 + K2 dx3 dx1 + K3 dx1 dx2 = hK, →

n i ds.
∂U ∂U

Luego, la fórmula (12.4) resulta en la ecuación


Z Z
∇.K dx1 dx2 dx3 = hK, →

n i ds (12.5)
U ∂U

Viviana A. Dı́az - Departamento de Matemática, UNS 107


CAPÍTULO 12. TEOREMAS INTEGRALES

A continuación, entonces, vamos a enunciar el teorema de la divergencia.

Teorema 12.1.1 Teorema de la divergencia o de Gauss para n = 2, 3.


Sea U ⊆ R3 , ∂U el borde de U que se supone una superficie regular a trozos orientada
positivamente (es decir, si x = x(u, v), u ∈ D es una parametrización de un trozo y


n =→ −n (x(u, v)) es la normal exterior, entonces Det(xu (u, v), xv (u, v), →

n ) > 0). Entonces
vale que
Z Z Z
∇.K dx1 dx2 dx3 = K1 dx2 dx3 + K2 dx3 dx1 + K3 dx1 dx2 = hK, →

n i ds.
U ∂U ∂U

Sea U ⊆ R2 , ∂U el borde de U que se supone regular a trozos y orientado positivamente (es


decir, si x = x(t), t ∈ D es una parametrización de un trozo y →

n =→ −n (x(t)) es la normal


exterior, entonces Det(xt (t), n ) < 0). Entonces vale que
Z Z Z
∇.K dx1 dx2 = K1 dx2 − K2 dx1 = hK, →

n i ds.
U ∂U ∂U

Teorema 12.1.2 Teorema de la divergencia n-dimensional.


Sea U ⊆ Rn abierto,
S ≡ ∂U, S = S1 + . . . + Sq donde cada trozo Si es regular con parametrización ((n − 1)-
dimensional).
Si x = x(u1 , u2 , . . . , un−1 ), (u1 , u2 , . . . , un−1 ) ∈ Di la parametrización de los trozos es


positiva (es decir, si el vector N = (J1 , J2 , . . . , Jn ) normal a S es exterior, donde
∂(x1 , x2 , . . . , x̂i , . . . , xn )
Ji = (−1)i
∂(u1 , u2 , . . . , un−1 )
con el sı́mbolo x̂i indica que xi está suprimido).



− N q
Se define n := → − y ds = J12 + J22 + . . . + Jn2 du1 . . . dun−1 . Luego, el volumen
kN k
q Z
X q
(n − 1)-dimensional de S es J12 + J22 + . . . + Jn2 du1 . . . dun−1 .
i=1 Si
El flujo de un campo F = (f1 , . . . , fn ) a través de S es
Z q Z q Z
hF, →
− hF, →

X X
n i ds = n i ds = [f1 J1 + . . . + fn Jn ] du1 . . . dun−1 =
S j=1 Sj j=1 Dj

q Z
X
= f1 dx2 . . . dxn − f2 dx1 dx3 . . . dxn + f3 dx1 dx2 dx4 . . . dxn + . . . =
j=1 Dj
q Z n
ˆ i . . . dxn (−1)i−1 .
X X
fi dx1 . . . dx
j=1 Dj i=1

Finalmente el teorema de la divergencia dice que


Z Z
∇.F = hF, →

n i ds
U ∂U

Viviana A. Dı́az - Departamento de Matemática, UNS 108


CAPÍTULO 12. TEOREMAS INTEGRALES

12.2. Flujo
Sea F = (f1 , f2 , f3 ) un campo vectorial en U ⊆ R3 y sea S una superficie, y supongamos
S orientada. De modo que si x = x(u, v) es una parametrización positiva de un trozo, entonces
queda determinado un sentido para la normal


− xu (u, v) × xv (u, v)
n (x(u, v)) = ,
k xu (u, v) × xv (u, v) k

donde la notación × indica el producto vectorial en R3 .


Recı́procamente, fijar para una superficie orientable un sentido de la normal (de modo que
la normal elegida varı́e continuamente de un punto a otro) equivale a fijar una orientación de la
superficie.

Definición 12.2.1 Se llama flujo de un campo vectorial F a través de una superficie S (con el
sentido de →

n elegido) a la integral
Z
hF, →

n i ds := F lujo.
S

Se comprueba que
Z " #
Z Z
∂(x2 , x3 ) ∂(x3 , x1 ) ∂(x1 , x2 )
hF, →

n i ds = hF, xu × xv i dudv = f1 + f2 + f3 dudv =
S S S ∂(u, v) ∂(u, v) ∂(u, v)
Z
= f1 dx2 dx3 + f2 dx3 dx1 + f3 dx1 dx2 .
S
Luego, podemos enunciar también el teorema de la divergencia como: La integral de la
divergencia de un campo vectorial F sobre una región U es igual al flujo de F a través del borde
∂U de U , donde ∂U se orienta con la normal exterior.

12.3. Rotor
Sea F = (f1 , f2 , f3 ) un campo vectorial definido en un conjunto abierto U ⊆ R3 .

Definición 12.3.1 Se llama rotor de F , y se indica rot(F ) o ∇ × F, al campo vectorial


! ! !
∂f3 ∂f2 →
− ∂f1 ∂f3 →
− ∂f2 ∂f1 →

∇×F = − e1+ − e2+ − e3
∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2

∂ ∂ ∂
Trabajando formalmente con ∇ = → −e1 +→ −
e2 +→

e3 como si fuese un vector de
∂x1 ∂x2 ∂x3
∂ ∂ ∂
componentes , , , el segundo miembro también se puede escribir como el determi-
∂x1 ∂x2 ∂x3
nante →
− →

e2 → −
e1 e 3
∂ ∂ ∂


∂x1 ∂x2 ∂x3

f1 f2 f3
que hay que desarrollar por la primera fila.

Viviana A. Dı́az - Departamento de Matemática, UNS 109


CAPÍTULO 12. TEOREMAS INTEGRALES

Proposición 12.3.2 Si f, g son campos vectoriales y ϕ es una función, vale que:

1. ∇ × (f + g) = ∇ × f + ∇ × g.

2. ∇ × (ϕf ) = ∇ϕ × f + ϕ(∇ × f ).

3. ∇ × ∇ϕ = 0.

4. ∇(∇ × ϕ) = 0.

Demostración: Como ejercicio.

12.4. Teorema de Stokes

A continuación, vamos a ver el teorema del rotor o teorema de Stokes.


Para ellos recordemos el teorema de la divergencia en el plano (n = 2) que afirma que
!
Z
∂K1 ∂K2 Z
+ dx1 dx2 = K1 dx2 − K2 dx1 .
U ∂x1 ∂x2 ∂U

Esta fórmula también se puede escribir, llamando (K1 , K2 ) ≡ (A2 , −A1 ), como la siguiente
igualdad conocida como Fórmula de Green.
!
Z
∂A2 ∂A1 Z
− dx1 dx2 = A1 dx1 + A2 dx2
U ∂x1 ∂x2 ∂U

Usando la fórmula de Green vamos a probar el siguiente teorema.

Teorema 12.4.1 Teorema de Stokes. Sea U ⊆ R2 abierto (conexo por simplicidad), ∂U el


borde de U orientado positivamente. Sea x : V → R3 una función definida en un abierto V que
contiene a U ∩ ∂U . Como es usual, se supone que x tiene derivadas continuas del orden que se
requiera, en este caso de orden 1. Supongamos además que x(u, v) = (x1 (u, v), x2 (u, v), x3 (u, v))


define una superficie regular (o sea que x es inyectiva y xu ×xv 6= 0 . Sea la superficie S definida
xu × xv
por x, con la orientación heredada de U y sea → −n = la normal. Sea C = x(∂U ) el
k xu × xv k
borde de S (con la orientación positiva heredada de ∂U ). Sea dS = kxu × xv k dudv el elemento


de superficie y sea ds el elemento de arco sobre C, y sea t el versor tangente a C.
Entonces se tiene, para cualquier campo vectorial H,


Z Z Z
h∇ × H, →

n i dS = hH, t i ds = H1 dx1 + H2 dx2 + H3 dx3 .
S C C

Equivalentemente,
! !
Z Z
∂x1 ∂x2 ∂x3 ∂x1 ∂x2 ∂x3
h∇×H, xu ×xv i dudv = H1 + H2 + H3 du+ H1 + H2 + H3 dv.
S ∂U ∂u ∂u ∂u ∂v ∂v ∂v

Viviana A. Dı́az - Departamento de Matemática, UNS 110


CAPÍTULO 12. TEOREMAS INTEGRALES

Demostración: El campo H se escribe como la suma de tres campos


H = H1 → −e 1 + H2 → −e 2 + H3 →

e 3 . Como ambos miembros de la igualdad a probar distribu-
yen respecto de la suma de campos, resulta que basta probar la igualdad para los campos
H1 →

e 1 , H2 →

e 2 , H3 →

e 3 . Haremos la prueba para H1 →
−e 1 , y los otros dos casos se tratan de modo
similar.
Tenemos que
∂H1 → ∂H1 →
∇ × H1 →−
e1= −
e2− −e 3,
∂x3 ∂x2
! ! !
∂x2 ∂x3 ∂x3 ∂x2 →
− ∂x3 ∂x1 ∂x1 ∂x3 →
− ∂x1 ∂x2 ∂x2 ∂x1 →

xu × xv = − e1+ − e2+ − e3
∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v
y ! !
∂H1 ∂x3 ∂x1 ∂x1 ∂x3 ∂H1 ∂x1 ∂x2 ∂x2 ∂x1
h∇ × H1 →

e 1 , xu × xv i = − − − =
∂x3 ∂u ∂v ∂u ∂v ∂x2 ∂u ∂v ∂u ∂v
! !
∂H1 ∂x3 ∂H1 ∂x2 ∂x1 ∂H1 ∂x3 ∂H1 ∂x2 ∂x1
= + − + .
∂x3 ∂u ∂x2 ∂u ∂v ∂x3 ∂v ∂x2 ∂v ∂u
∂H1 ∂x1 ∂x1
Sumando y restando el término resulta
∂x1 ∂u ∂v
!

− ∂H1 ∂x1 ∂H1 ∂x2 ∂H1 ∂x3 ∂x1
h∇ × H1 e 1 , xu × xv i = + + −
∂x1 ∂u ∂x2 ∂u ∂x3 ∂u ∂v
!
∂H1 ∂x1 ∂H1 ∂x2 ∂H1 ∂x3 ∂x1
+ + .
∂x1 ∂v ∂x2 ∂v ∂x3 ∂v ∂u
Llamando H 1 (u, v) = H1 (x1 (u, v), x2 (u, v), x3 (u, v)) resulta, por la regla de la cadena, que
! !
∂x1 ∂x1
∂ H1 ∂ H1
∂H 1 ∂x1 ∂H 1 ∂x1 ∂v ∂u
h∇ × H1 →

e 1 , xu × xv i = − = − .
∂u ∂v ∂v ∂u ∂u ∂v
Luego, usando la fórmula de Green, resulta
    
Z ∂ H 1 ∂x
∂v
1
∂ H 1 ∂x
∂u
1 Z
∂x1 ∂x1
 −  dudv = H1 + H1 .
U ∂u ∂v ∂U ∂u ∂v
Z Z
∂x1 ∂x1 Z
Es decir, h∇ × H1 →

e 1 , xu × xv i dudv = H1 du + H 1 dv = H 1 dx1 .
S Z Z ∂U ∂u ∂v ∂U
Por otro lado, H1 dx1 = H 1 dx1 . Luego
C ∂U
Z Z
h∇ × H1 →

e 1 , xu × xv i dudv = H 1 dx1 
S ∂U

El teorema de Stokes se generaliza fácilmente para el caso de una superficie S regular a trozos,
con borde regular a trozos. Como consecuencia, una superficie cerrada regular a trozos S se puede
considerar como una superficie de borde ∂S vacı́o y entonces se tiene


Z Z


h∇ × H, n i dS = hH, t i ds = 0 (la demostración de esto no es sencilla).
S ∂S

Viviana A. Dı́az - Departamento de Matemática, UNS 111


Bibliografı́a

[1] R.G. Bartle. The Elements of Real Analysis. John Wiley and Sons, Inc., First Edition, 1964.

[2] W.E. Boyce and R.C. DiPrima. Ecuaciones diferenciales y problemas con valores en la
frontera. Limusa-Willey, Cuarta Edición, 1964.

[3] H. Cendra. Apunte de análisis en varias variables. Preprint.

[4] G. Larotonda. Cálculo y Análisis. Universidad de Buenos Aires, cursos de grado, fascı́culo 3,
Edición 2010.

[5] J.E. Marsden and M.J. Hoffman. Análisis clásico elemental. Addison-Wesley Iberoamericana,
Segunda Edición, 1998.

[6] W. Mora. Cálculo en varias variables. Revista digital Matemática, Eduacación e Internet.
Instituto Tecnológico de Costa Rica, Segunda Edición, 2019.

[7] R.K. Nagle, E.B. Saff, and A.D. Snider. Fundamental of Differential Equations. Addison
Wesley, Eighth Edition, 2012.

[8] R.A. Sáenz. Análisis en varias variables. Preprint.

112

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy