Sunteți pe pagina 1din 279

Termodinamica y Mecanica Estadstica I

Notas de Clase 2015


Sergio A. Cannas
FaMAF-UNC

1.

Postulados de la Termodin
amica

1.1.

Introducci
on: equilibrio termodin
amico y variables de estado

La termodinamica no es solamente la descripcion fsica de los fenomenos termicos, es una teora


general acerca del comportamiento macrosc
opico de la materia agregada. La misma se origina en
la observacion de que ciertas propiedades globales de la materia satisfacen relaciones entre s que
obedecen a leyes aparentemente universales, independientes de la naturaleza intrnseca del material. Una de las observaciones mas importantes es que la materia agregada presenta, en ausencia
de perturbaciones externas, estados macroscopicos que son estables y no cambian en el tiempo.
Estos estados de equilibrio estan caracterizados por propiedades mecanicas definidas (color,
tama
no, forma, dureza, etc), pero que cambian ante una perturbacion externa, tal como un cambio de temperatura o presion. No obstante, todo estado de equilibrio puede ser recuperado con
una perturbacion inversa a la anterior. En otras palabras, los estados de equilibrio se encuentran unvocamente determinados por los valores de un conjunto reducido de par
ametros
macrosc
opicos. Esto implica que las propiedades de sistemas en equilibrio no solamente permanecen invariantes en el tiempo, sino que ademas no presentan memoria acerca del proceso
mediante el cual se alcanzo el equilibrio. Esto no siempre es asi. Existen muchos materiales que
guardan memoria de su historia de fabricacion. Por ejemplo, un metal solidificado mediante un
enfriamiento brusco (templado) presenta propiedades de dureza muy diferentes a otro identico solidificado lentamente (recocido). No obstante, se observa que tarde o temprano esta memoria se
pierde, es decir, en todos los sistemas existe una tendencia a evolucionar hacia estados mas simples, en los cuales sus propiedades estan determinadas solo por factores intrnsecos y no por las
influencias externas que actuaron previamente. Estos estados mas simples son independientes del
tiempo y son llamados estados de equilibrio.
La termodin
amica describe las leyes que gobiernan los estados de equilibrio.
Las variables que caracterizan los estados de equilibrio se conocen como variables de estado.
Esas variables dependen del sistema en consideracion. No obstante estas pueden agruparse en ciertas
categoras generales para todo tipo de sistema. Vamos a distinguir entre variables o par
ametros
extensivos, definidos como aquellos cuyo valor depende del tama
no del sistema y variables o
par
ametros intensivos como aquellos en que no depende. Esto es, si X es una propiedad extensiva
y tenemos dos sistemas identicos, entonces para el sistema compuesto tendremos que X es el doble
del valor de uno de los subsistemas. En otras palabras, variables extensivas son aditivas y las
intensivas no. Ejemplos de variables extensivas son el vol
umen y el n
umero de partculas. Ejemplos
de variables intensivas son la temperatura y la presion.
En particular las variables asociadas a las propiedades termicas son centrales en la descripcion
termodinamica de cualquier sistema. A fin de simplificar la formulaci
on vamos a considerar una serie
de simplificaciones acerca de las propiedades mecanicas, electricas y magneticas de los sistemas. En
1

Termodinamica y Mecanica Estadstica I - Notas 2015

una etapa posterior vamos a ver como estas y otras propiedades pueden ser incorporadas facilmente
a la formulacion inicial en el caso de sistemas con interacciones mas complejas. Vamos entonces
a restringir nuestra atencion al caso de sistemas simples, definidos como sistemas macrosc
opicamente homogeneos, isotr
opicos y electricamente neutros, los cuales son suficientemente grandes
como para que los efectos superficiales puedan ser despreciados y sobre los cuales no actuan ningun
tipo de campo externo (electrico, magnetico o gravitacional). Para un sistema de este tipo cualquier
variable electromagnetica macroscopica es cero (magnetizacion, polarizacion electrica, etc). Bajo
estas consideraciones la u
nica variable mecanica extensiva relevante es el vol
umen V (el sistema es
homogeneo, isotropico y no actuan fuerzas externas).
Vamos a considerar ademas que estos sistemas poseen una composici
on qumica definida, la
cual puede ser descripta por el n
umero de partculas (atomos o moleculas) de cada componente
qumica pura de la mezcla. Alternativamente pueden utilizarse n
umero molar de cada componente
(esto permite trabajar con n
umeros mas razonables), definida como el cociente entre el n
umero de
moleculas y el n
umero de Avogadro. Supongamos que el sistema es una mezcla de r componentes
qumicas, donde Ni es el n
umero molar de la componente i-esima. Se define la fracci
on molar como
P
el cociente xi = Ni /( rj=1 Nj ) (i = 1, . . . , r). La cantidad
v = V /(

r
X

Nj ) = 1

(1)

j=1

se denomina el vol
umen molar y donde es la densidad molar. Los n
umeros molares son evidentemente variables extensivas.

1.2.

Perspectiva hist
orica: Conceptos de energa interna y calor

A pesar de la enorme generalidad de la Termodinamica, esta teora esta basada en cuatro leyes
fundamentales, las cuales a grosso modo establecen lo siguiente:
Ley cero: Existen los estados de equilibrio termodinamico. Dos sistemas en equilibrio con
un tercero se encuentran en equilibrio entre s.
Primera Ley: La energa se conserva.
Segunda Ley: No existe una transformacion cuyo u
nico efecto total sea transferir calor de
una fuente fria a una mas caliente (postulado de Clausius).
Tercera Ley: El cero absoluto de temperatura es inaccesible (Nernst).
Historicamente estas leyes fueron formuladas sobre una base emprica macroscopica mucho
antes del descubrirse la naturaleza atomica de la materia. Con el posterior desarrollo de la Mecanica
Estadstica las mismas pudieron ser fundamentadas sobre la base de las interacciones microscopicas
entre las partculas constituyentes de la materia.
Si bien a lo largo del curso de Termodinamica a menudo haremos uso de argumentos microscopicos para justificar algunas suposiciones, estos no son fundamentales a la teora; la misma puede
formularse en forma axiomatica, en base a postulados cuya validez u
ltima se confirma a traves de
verificaciones experimentales de sus predicciones. De hecho veremos que la teora puede formularse en base a postulados matematicos mucho mas formales, pero enteramente equivalentes a las
tradicionales cuatro leyes. Pero antes vamos a analizar un poco algunos de los conceptos contenidos
en las cuatro leyes en su forma tradicional a fin de discutir algunos contenidos fsicos e introducir
algunas definiciones.

Termodinamica y Mecanica Estadstica I - Notas 2015


1.2.1.

Calor y energa interna

Primero podemos observar que la numeraci


on de las leyes responde a su desarrollo historico.
La primera ley fue postulada por diversas personas (Mayer, Joule, etc) durante el el siglo XIX
al proponerse el calor como una forma de energa (previamente ya exista el concepto de calor,
pero era considerado un fluido). En base al conocimiento previo de un principio de conservaci
on
de la energa mecanica resulto entonces natural asumir un principio semejante para los sistemas
macroscopicos, postulando la existencia de una energa termodinamica o, como la denominaremos
de aqui en mas, energa interna y la denotaremos por U . De esta manera, calor y trabajo mecanico
resultan vinculados como dos formas diferentes de energa. Si los intercambios de calor y trabajo
ocurren en un sistema aislado, tienen que ser tales que la energa interna del sistema se conserve. De
su definicion, la energa interna es una variable de estado; siendo una cantidad conservativa,
U es extensiva. Conociendo la estructura atomica de la materia, el principio de conservaci
on de
la energa resulta totalmente natural si consideramos a los sistemas termodinamicos como sistemas
mecanicos compuestos por un n
umero enorme de partculas, interactuando a traves de fuerzas bien
definidas. No obstante, al postular desde una teora macroscopica una energa interna como variable
de estado debemos garantizar que la misma sea una cantidad controlable y medible.
1.2.2.

Paredes y vnculos

Que sea controlable significa que existan recipientes para contener el sistema que impidan todo
tipo de intercambio energetico con el exterior, de manera que U sea una variable de estado bien
definida. Por otra parte, vamos a requerir que dichos recipientes puedan ser manipulados de manera
tal de permitir transformaciones que me lleven de un estado de equilibrio a otro diferente. Para
esto vamos a postular la existencia de paredes ideales, las cuales restringen la redistribucion
de cierta cantidad entre diferentes sistemas o entre diferentes porciones de un mismo sistema.
Tomemos por ejemplo un cilindro cerrado con un piston interno separando dos sistemas simples
diferentes (pensemos en dos fluidos). Si las paredes del cilindro y el piston son totalmente rgidas
y el piston se encuentra perfectamente fijo, el mismo impide una redistribucion del vol
umen en el
sistema compuesto. Si por el contrario el piston puede moverse libremente se producira una cierta
redistribucion interna en el vol
umen. Decimos en el primer caso que el cilindro y el piston fijo
constituyen paredes restrictivas respecto del vol
umen, en tanto que el piston libre es una pared no
restrictiva respecto del vol
umen.
En general para cada variable de estado extensiva vamos a postular la existencia de paredes
especficas restrictivas y no restrictivas, seg
un prevengan o no la redistribucion de dicha variable.
Una pared restictiva respecto al intercambio de materia, es decir, respecto de la redistribucion
de los n
umeros molares, es una pared impermeable. Una pared no restrictiva respecto del n
umero
molar de cierta componente qumica, pero restrictiva respecto respecto de los n
umeros molares del
resto de las componentes se denomina un membrana semipermeable.
El caso de la energa interna es un poco diferente, ya que la redistribucion de la misma puede
llevarse a cabo tanto por intercambio de trabajo como de calor. Una pared restrictiva respecto del
vol
umen impide el intercambio de trabajo. Una pared restricitiva con respecto al intercambio de
calor se denomina adiab
atica, en tanto que una pared que permite el intercambio libre de calor se
denomina diat
ermica. Una pared rgida y adiabatica es restrictiva respecto de la energa interna.
Un sistema encerrado por paredes rgidas y adiabaticas constituye un termo perfecto. Un sistema
simple confinado por paredes restrictivas respecto de la energa constituye un sistema cerrado (la
restriccion respecto del intercambio de materia se encuentra implcita, ya que no es posible restringir
el intercambio de calor en un sistema que intercambia materia).

Termodinamica y Mecanica Estadstica I - Notas 2015


1.2.3.

Mesurabilidad de la energa interna y el calor

Disponer de paredes adiabaticas nos permite formular un metodo para medir la energa interna.
Al igual que en mecanica el cero de la misma no esta definido, ya que como veremos las cantidades con sentido fsico, es decir medibles, son las diferencias de energa entre dos estados. Si
encerramos nuestro sistema en un recipiente adiabatico la u
nica manera de producir cambios en la
energa interna es realizando trabajo, el cual podemos calcularlo a partir de la mecanica. Asi, si
el trabajo es realizado comprimiendo el sistema (pensemos, por ejemplo, en un gas encerrado en
un cilindro adiabatico con un piston), el mismo resulta el producto de la presion por el cambio de
vol
umen. Otra forma sera introducir un eje con una helice a traves de un orificio en el recipiente y
hacerla girar; en este caso el trabajo resulta el producto del torque ejercido por el desplazamiento
angular. El cambio en la energa interna sera igual al trabajo realizado. De esta manera, podemos
medir la diferencia de energa entre dos estados de equilibrio, siempre que exista una transformacion puramente mecanica que me lleve de uno al otro. Esto nos lleva a cuestionarnos si, dados
dos estados de equilibrio arbitrarios, es siempre posible encontrar una transformacion puramente
mecanica que los conecte. Es posible mostrar que, dados dos estados de equilibrio A y B, siempre
existe al menos una transformacion adiabatica que nos lleva de A a B, o bien de B a A. El hecho
de que para ciertos estados solo exista una trasformacion adiabatica en un solo sentido se relaciona
con la segunda ley y lo analizaremos mas adelante. Por ahora para lo que nos interesa es suficiente
con que exista al menos una de las transformaciones, ya que eso nos permite medir diferencias de
energas.
El poder medir diferencias de energas internas entre cualquier par de estados nos permite
dar una definicion quantitativa de calor. Dado un sistema simple, el flujo de calor en cualquier
transformacion arbitraria a n
umeros de moles constantes es simplemente la diferencia de energa
entre los estados final e inicial menos el trabajo realizado sobre el sistema. La primera puede medirse
buscando una transformacion adiabatica entre los estados inicial y final, en tanto que el segundo
se calcula por las formulas de la mecanica.
Con estas consideraciones podemos poner en terminos formales la primera ley. Consideremos
primero el trabajo mecanico en un sistema simple. Si el trabajo es realizado mediante compresion,
para un cambio infinitesimal en el vol
umen dV tendremos
d0 WM = P dV

(2)

Esta formula merece algunos comentarios:


1. La presion que aparece en la formula es la presion en equilibrio o hidrostatica. Para que esta
formula sea aplicable debe corresponder a un proceso quasiest
atico. Definimos un proceso
quasiestatico como uno infinitamente lento, es decir, en el cual la condiciones externas son
variadas tan lentamente, que en cada etapa del proceso el sistema se encuentra en equilibrio y
por lo tanto las variables de estado se encuentran bien definidas. Tomemos por ejemplo el caso
de un gas en un cilindro adiabatico con un piston movible. Si empujamos el piston muy rapido
el gas localizado mas cerca del piston adquiere energa cinetica y por lo tanto el gas desarrolla
un movimiento turbulento, en el cual la presion no esta bien definida. Despues de un cierto
tiempo el gas alcanzara un estado de equilibrio, pero en este caso el trabajo realizado nos
estara dado por la formula anterior. Si por el contrario el piston es empujado a una velocidad
infinitesimalmente peque
na, en cada instante el gas estara esencialmente en equilibrio a una
presion igual a la aplicada al piston. Procesos quaiestaticos son evidentemente una idealizacion
y, aunque en la practica pueden ser aproximados razonablemente por procedimientos muy
lentos, para nosotros constituyen una herramienta teorica la cual debe interpretarse no como
un proceso temporal, sino mas bien como una sucesion de estados de equilibrio.
2. Por convencion tomaremos el trabajo como positivo si incrementa la energa interna del

Termodinamica y Mecanica Estadstica I - Notas 2015

sistema. Si el vol
umen disminuye estamos realizando trabajo sobre el sistema y por lo tanto
U aumenta; de ahi el signo menos en la formula.
3. El smbolo d0 denota una diferencial imperfecta. Esto significa que la integral de d0 W para un
dado proceso depende del proceso particular utilizado. Esto es, el trabajo realizado para llevar
un sistema de un estado de equilibrio a otro depende del camino de integraci
on que conecta
dichos estados. De esta manera la formula anterior debe interpretarse como una variaci
on
infinitesimal y no como una diferencial exacta de una funcion continua y diferenciable de
varias variables, para la cual la integral entre dos estados fijos es independiente del camino
de integraci
on, es decir, del proceso particular que lleva de uno a otro. Las diferenciales de
variables de estado son siempre diferenciales exactas.
Con estas consideraciones el flujo infinitesimal de calor, para un proceso quasiestatico a n
umero
de moles constantes queda definido por
d0 Q = dU d0 WM = dU + P dV

(3)

dU = d0 Q + d0 WM

(4)

o bien

que es la expresion infinitesimal de la primera ley. Notemos que hemos escrito el diferencial de
U como una diferencial exacta (sin la prima). Esto es porque U es una variable de estado. En
otras palabras, los intercambios quasiestaticos de calor y trabajo mecanico dependen del proceso
particular, pero de forma tal que su suma es siempre independiente del mismo.
1.2.4.

Segunda ley

La segunda ley es la mas importante de la termodinamica. Casi podramos decir, que la segunda
ley es la termodinamica. La misma fue postulada por diferentes personas de diferentes maneras, y
se relaciona con la forma en la cual se transfiere el calor. Por ejemplo, si bien podemos transformar
cierta cantidad de trabajo ntegramente en calor, la recproca no es cierta. En toda maquina termica
que transforma calor en trabajo, cierta cantidad de calor es siempre desperdiciada (postulado de
Kelvin). Estos distintos postulados, que puede verse que son enteramente equivalentes, tienen una
forma cualitativa. Esto llevo a la necesidad de introducir cierta cantidad ad hoc que se denomino
entropa termodin
amica (Clausius) a fin de cuantificar las consecuencias de la segunda ley. No
obstante, en su forma tradicional esta formulaci
on resulta bastante engorrosa y confusa. En el
presente curso vamos a adoptar un punto de vista mas moderno y formal, en el cual comenzaremos
por introducir nuevos postulados. En estos vamos a asumir la existencia de una funcion entropa y
un principio variacional asociado. A posteriori veremos como todas las propiedades asociadas a la
segunda ley pueden ser deducidas de estos postulados, de manera enteramente consistente.
Para finalizar esta introduccion comentemos un poco las dos leyes restantes. La ley cero, como
su numeracion lo indica, fue introducido a posteriori de las leyes primera y segunda. La misma constituye un postulado de consistencia. Mas a
un, la propiedad de transitividad asociada a los estados
de equilibrio resulta necesaria para que tenga sentido el concepto de term
ometro. Si ponemos en
contacto cierto tipo de termometro (como por ejemplo una columna de mercurio) con un sistema de
referencia, tal como una mezcla fundente de agua y hielo, las propiedades mecanicas del termometro
(tal como la altura de la columna de mercurio) toman siempre el mismo valor. Si ahora ponemos el
termometro en contacto con un tercer sistema y las propiedades mecanicas no cambian, podemos
decir que la temperatura de dicho sistema es la misma que la del sistema de referencia. En cuanto
a la tercera ley, la misma constituye un desarrollo posterior, basado en la evidencia experimental.
La misma no juega ning
un papel importante en el desarrollo de la teora termodinamica y por lo

Termodinamica y Mecanica Estadstica I - Notas 2015

tanto examinaremos sus consecuencias mas adelante en el curso. Hasta aqui la enunciamos solo por
completitud.

1.3.

Postulados de la Termodin
amica

Postulado I: Existen estados particulares de los sistemas simples (llamados estados de equilibrio) los cuales, macrosc
opicamente, estan completamente caracterizados por la energa interna U ,
el vol
umen V y los n
umeros molares N1 , N2 , . . . , Nr de sus componentes qumicas.
Notemos que este postulado es una mezcla de la ley cero y la primera ley, pero con algunas
diferencias. Primero, no se hace referencia a la transitividad de los estados de equilibrio; esto surgira naturalmente de los desarrollos posteriores. Segundo, si bien no se hace una referencia explcita
a la primera ley, al postular U como una variable de estado y medible, estamos aceptando implcitamente el principio de conservacion junto con el concepto de calor antes expuesto. Finalmente, el
aspecto mas importante y novedoso es que se estipulan claramente cual es el conjunto de variables
de estado que describen completamente los estados de equilibrio para cualquier sistema simple; evidentemente existen otras variables asociadas a diferentes propiedades, pero estas seran dependientes
de las anteriores.
Problema central de la termodin
amica:
La siguiente pregunta que uno se plantea es que ocurre si uno pone en contacto dos sistemas
simples, inicialmente aislados y cada uno en equilibrio independientemente. Podemos pensar que
inicialmente ambos sistemas se encuentran encerrados por un u
nico recipiente que los aisla del resto
del universo y separados entre s por una pared restrictiva respecto de la energa, de manera tal que
cada uno de los subsistemas se encuentra aislado a su vez. Para fijar ideas podemos pensar en un
cilindro cerrado con un piston interior que separa ambos susbsistemas (ver figura 1). Cada una de
las restricciones impuestas al piston constituye un vnculo interno del sistema compuesto. Si el
piston es totalmente restrictivo, el estado de cada uno de los subsistemas estara caracterizado por
(2)
(1)
un conjunto de valores U (1) , V (1) , N1 , . . . y U (2) , V (2) , N1 , . . .. El estado del sistema compuesto
se encuentra a su vez en equilibrio, caracterizado por el mismo conjunto de parametros. Si ahora
removemos alguno de los vnculos (o todos), se iniciara un proceso al final del cual el sistema
compuesto estara nuevamente el equilibrio. En este nuevo estado los valores de los parametros
extensivos del sistema total no habran cambiado, ya que todos estos parametros son conservativos.
(1)
(2)
Sin embargo los valores de U (1) , V (1) , N1 , . . . y U (2) , V (2) , N1 , . . . en principio seran diferentes de
los valores iniciales, sujetos por supuesto a las restricciones de que U (1) + U (2) = cte, V (1) + V (2) =
cte, etc. El problema a resolver consiste entonces en la determinacion de dichos valores. Como
veremos, todos los resultados de la termodinamica se derivan de la solucion de esta problema,
motivo por lo cual lo llamaremos el problema central de la termodin
amica.
Notemos que el concepto de sistema compuesto es suficientemente general como para abarcar
a su vez los sistemas simples. Podemos pensar que todo sistema esta subdividido en subsistemas
separados por paredes virtuales las cuales pueden o no ser restrictivas; dicho de otra manera, el
sistema puede incluir o no vnculos internos. De esta manera podemos reformular el problema como
sigue:
Si un sistema cerrado se encuentra en equilibrio con respecto a sus vnculos internos, y si
algunos de estos vnculos son removidos, se inician ciertos procesos que previamente no estaban permitidos y que llevan al sistema a un nuevo estado de equilibrio. La predicci
on de este
nuevo estado de equilibrio es el problema central de la termodin
amica.
Vamos a presentar una solucion a este problema a traves de un principio variacional.
Postulado II: Existe una funcion (llamada entropa S) de los parametros extensivos de todo
sistema compuesto, definida para todos los estados de equilibrio (y solo para ellos), con la

Termodinamica y Mecanica Estadstica I - Notas 2015

U(2), V(2), N1(2),...

U(1), V(1), N1(1),...

Pistn

Cilindro rgido y adiabtico

Figura 1:
siguiente propiedad: los valores asumidos por los parametros extensivos de cada subsistema en
ausencia de alg
un vnculo interno son aquellos que maximizan la entropa entre el conjunto de
todos los estados de equilibrio consistentes con los vnculos internos que restan y los vnculos
externos.
Analicemos con cuidado este enunciado.
Primero debemos recalcar que la entropa es funcion defnida exclusivamente para estados
de equilibrio. En este enunciado no hay ninguna referencia a ning
un proceso temporal; se refiere
exclusivamente a lo que ocurre una vez que el sistema ha alcanzado nuevamente el equilibrio luego
de retirar el vnculo interno. En ausencia del vnculo el sistema es libre de seleccionar cualquier
estado de equilibrio entre aquellos que conservan la energa, el vol
umen, etc, cada uno de los cuales
puede ser obtenido en presencia de un vnculo apropiado. La entropa de cada uno de estos estados
esta definida y es maxima para algun estado particular; en ausencia del vnculo este estado es el
seleccionado por el sistema. Notemos que a partir de estas definiciones, la entropa resulta tambien
una variable de estado.
Tomemos un ejemplo. Supongamos que el vnculo que removemos sea la restriccion para el
intercambio de calor, es decir, que la pared adiabatica se convierte en diatermica, pero continua
siendo rgida e impermeable. En esta situacion los valores de las energas U (1) y U (2) se redistribuiran
de manera tal que su suma permanezca constante.Ahora bien, para cada par de valores (U (1) , U (2) )
que satisfacen U (1) + U (2) = U podemos construir un estado de equilibrio siempre que los sistemas
esten aislados entre s (estados restringidos). Entre todos estos estados el sistema elegira, al remover
el vnculo, el de mayor entropa (ver figura 2).
Ahora bien, el problema central de la termodinamica puede ser resuelto, de acuerdo con el
postulado anterior, si conocemos la relacion funcional entre la entropa de nuestro sistema y sus
parametros extensivos. Como mencionamos anteriormente, todas las propiedades termodinamicas
pueden ser derivadas de la solucion del problema central. Esto significa que si conocemos la relaci
on
funcional entre S y los par
ametros extensivos de un sistema podemos derivar de ella absolutamente
toda la informaci
on termodin
amica del mismo. De ahi que se la denomina la relaci
on fundamental.
El siguiente postulado complementa el anterior estableciendo algunas propiedades matematicas

Termodinamica y Mecanica Estadstica I - Notas 2015

Figura 2: Representacion esquematica de la funcion entropa para un sistema compuesto por dos
subsistemas de energas U (1) y U (2) separados por una pared adiabatica, tal que U (1) + U (2) = U ; al
remover el vnculo adiabatico el sistema escoge el estado de maxima entropa sujeto a la restriccion
U (1) + U (2) = U .
de la funcion entropa de cualquier sistema. Muchas de las consecuencias generales mas importantes
de la termodinamica se derivan del mismo.
Postulado III: La entropa de un sistema compuesto es aditiva sobre los subsistemas constituyentes. La entropa es una funcion continua, diferenciable y es una funcion monotona creciente
de la energa.
Analicemos primero las consecuencias de la aditividad. Esta propiedad significa que si tenemos
varios sistemas aislados entre s, para cada uno tendremos una funcion
()

(5)

()

(6)

S () = S () (U () , V () , N1 , . . . , Nr() )
y la entropa del sistema compuesto sera
S=

S () (U () , V () , N1 , . . . , Nr() )
P

donde los valores de las variables extensivas del sistema compuesto estaran dados por U = U () ,
P
V = V () , etc. Por simplicidad supongamos que tenemos solo dos subsistemas 1 y 2 y supongamos que tenemos una sola componente qumica cuyo n
umero de moles es N . Si ambos subsistemas
(1)
(1)
(2)
(2)
(2)
(1)
estan aislados entre s con valores particulares (U0 , V0 , N0 ) y (U0 , V0 , N0 ), S resulta en
este caso una funcion de cada uno de los valores individuales de los parametros de cada subsistema:
(1)

(1)

(1)

(2)

(2)

(2)

(1)

(1)

(1)

(2)

(2)

(2)

S = S(U0 , V0 , N0 , U0 , V0 , N0 ) = S (1) (U0 , V0 , N0 ) + S (2) (U0 , V0 , N0 )

(7)

Si ahora removemos los vnculos internos, de acuerdo con el postulado II, los subsistemas en el
(1)
(1)
(1)
(2)
(2)
(2)
nuevo estado de equilibrio adoptaran nuevos valores (Uf , Vf , Nf ) y (Uf , Vf , Nf ), que son
aquellos que maximizan la expresion (7) entre todos aquellos que satisfacen U (1) + U (2) = U , etc
(ver figura 2). Dado que S es continua y diferenciable, podemos calcular dichos valores por simple
diferenciacion si conocemos las funciones S (1) y S (2) . En este caso tendremos definida una relacion
funcional para el sistema compuesto
(1)

(1)

(1)

(2)

(2)

(2)

S(U, V, N ) = S (1) (Uf , Vf , Nf ) + S (2) (Uf , Vf , Nf )

(8)

Termodinamica y Mecanica Estadstica I - Notas 2015

Ahora hagamos un razonamiento a la inversa. Supongamos que tenemos un sistema cuya relacion
fundamental es S = S(U, V, N ) y lo partimos en dos subsistemas id
enticos con parametros U0 =
U/2, V0 = V /2, N0 = N/2. Al separarlos cada uno de esos subsistemas estara en equilibrio y si los
volvemos a juntar estaran en equilibrio entre s. Es importante comprender que cada uno de esos
subsistemas es un caso particular del sistema original con los valores de sus parametros reducidos
a la mitad, y por lo tanto cada uno de ellos tendra una entropa S (0) (U0 , V0 , N0 ) = S(U0 , V0 , N0 ).
De la aditividad de la entropa y dado que los subsistemas son indenticos surge que
S(2U0 , 2V0 , 2N0 ) = 2S(U0 , V0 , N0 )

(9)

esto es, S es extensiva. Pero podemos repetir este procedimiento y partir el sistema original en
subsistemas identicos. Omitiendo el subndice 0, tenemos que la funcion S(U, V, N ) satisface la
propiedad
S(U, V, N ) = S(U, V, N )

(10)

Una funcion de varias variables F (x1 , x2 , . . .) que satisface la propiedad


F (x1 , x2 , . . .) = F (x1 , x2 , . . .)

(11)

para valores arbitrarios de la constante se dice que es homogenea de orden . De la aditividad


hemos concluido entonces que la entropa es una funcion homogenea de primer orden de los
par
ametros extensivos del sistema.
Notemos que si bien S es extensiva, no es conservativa. Toda variable conservativa es extensiva, pero la recproca no es cierta. Para un sistema compuesto, cerrado, la energa total es la suma
de las energas de los susbsistemas constituyentes, exista o no un vnculo interno que los aisle entre
(1)
(2)
s. Si ambos subsistemas aislados tienen valores de entropa Si y Si , la entropa total para el
(1)
(2)
sistema con el vnculo es Si = Si + Si ; al remover el vnculo esto no es mas necesariamente
(1)
(2)
cierto, ya que por el principio de maxima entropa (postulado II) Sf Si + Si .
Una consecuencia interesante de la propiedad de homogeneidad de la entropa es que para
sistemas con una sola componente qumica podemos expresar todas las propiedades de un sistema
de N moles a partir de las de un sistema de 1 mol. Si tomamos = 1/N en la Ec.(10) tenemos que
S(U, V, N ) = N S(U/N, V /N, 1).

(12)

Pero v = V /N es el vol
umen molar y u U/N es la energa por mol. Asi
s(u, v) S(U/N, V /N, 1) = S(u, v, 1)

(13)

es la entropa de 1 mol. De esta manera la Ec.(12) se reduce a


S(U, V, N ) = N s(u, v).

(14)

La propiedad de monotona de la entropa respecto de la energa implica que

S
U

>0

(15)

V,N1 ,...,Nr

Mas adelante vamos a ver que la recproca de esta derivada parcial se toma como definicion
de temperatura absoluta (y por supuesto vamos a ver que la misma coincide con los conceptos
intuitivo y termometrico de temperatura). Esta propiedad por lo tanto es equivalente a postular
que la temperatura es no negativa.
Las propiedades de continuidad, diferenciabilidad y monotona juntas implican que S como funcion de U es invertible y que la energa es una funci
on continua y diferenciable de S, V, N1 , . . . , Nr .
Por lo tanto, conociendo la funcion

Termodinamica y Mecanica Estadstica I - Notas 2015

10

S = S(U, V, N1 , . . . , Nr )

(16)

podemos despejar de manera unvoca U y obtener


U = U (S, V, N1 , . . . , Nr )

(17)

Las Ecs.(16) y (17) son formas alternativas equivalentes de la relacion fundamental y cada
una de ellas contiene toda la informacion termodinamica acerca del sistema. Notemos que por los
mismos argumentos utilizados para la entropa, se concluye que U es una funcion homogenea de
primer orden.
Postulado IV:

U
S

=0

S=0

(18)

V,N1 ,...,Nr

Como ya hemos mencionado, esta derivada parcial es la temperatura. Este postulado nos dice
entonces que la entropa de cualquier sistema se anula a temperatura cero. Puede verse que de los
postulados antes expuestos se deduce que no existe ninguna transformacion quasiestatica que nos
permita alcanzar un estado de entropa cero. Asi, el cero absoluto de temperatura, si bien existe
como un lmite teorico, es inalcanzable en la practica. Este postulado es por lo tanto equivalente al
de Nernst o tercera ley. En realidad la entropa siendo una cantidad aditiva no tiene un cero bien
definido. Este postulado lo que nos dice es que la entropa tiene un mnimo que resulta inaccesible.
Convencionalmente se toma su valor como el cero de la entropa.

Termodinamica y Mecanica Estadstica I - Notas 2010

2.

11

Las condiciones de equilibrio

Vamos a analizar a continuacion las formas diferenciales de las relaciones fundamentales. Esto
nos permitira introducir una serie de definiciones e identificar propiedades de la relacion fundamental con los conceptos de calor y trabajo.

2.1.

Par
ametros intensivos

Tomemos la relacion fundamental descripta por la energa


U = U (S, V, N1 , . . . , Nr )

(19)

y calculemos su diferencial primera

dU =

U
S

dS +
V,N1 ,...,Nr

U
V

dV +
S,N1 ,...,Nr

r
X
j=1

U
Nj

dNj

(20)

S,V,...,Nr

Introducimos ahora las siguientes definiciones:

U
S V,N1 ,...,Nr

V S,N1 ,...,Nr

U
Nj

T,

temperatura

(21)

P,

presi
on

(22)

potencial qumico de la componente j

(23)

S,V,...,Nr

Con esta notacion la Ec.(20) resulta


dU = T dS P dV +

r
X

j dNj

(24)

j=1

Las definiciones de temperatura y presion aqui introducidas deben tomarse por ahora como
definiciones formales, las cuales veremos que resultan consistentes con los conceptos ya conocidos a
medida que avancemos en el desarrollo de la teora. Asumiendo que estas definiciones tienen sentido
fsico, podemos identificar el termino P dV en la Ec.(24) con el trabajo cuasi-estatico introducido
anteriormente d0 WM . En el caso particular de n
umeros de moles constantes dN1 = dN2 = dNr = 0
tenemos de la Ec.(24)
T dS = dU d0 WM .

(25)

Comparando esta u
ltima ecuacion con la forma diferencial de la primera ley nos lleva inmeditamente
a la identificacion de T dS con el flujo cuasi-est
atico de calor:
d0 Q = T dS,

(26)

esto es, el flujo cuasi-est


atico de calor dentro de un sistema esta asociado con un incremento en
la entropa del mismo. Los restantes terminos en la Ec.(24) estan asociados a un incremento en la
energa por la adicion de materia. Vamos a definir el trabajo qumico cuasi-est
atico d0 Wq como
d0 Wq =

r
X
j=1

Tenemos entonces que

j dNj .

(27)

Termodinamica y Mecanica Estadstica I - Notas 2010

dU = d0 Q + d0 WM + d0 Wq

12

(28)

Cada uno de los terminos en la equacion anterior tiene dimensiones de energa. Notemos que
hasta aqui solo el producto de la temperatura y la entropa tiene dimensiones definidas y las
dimensiones individuales de cada cantidad estan hasta el momento indeterminadas. Discutiremos
este tema mas adelante. El potencial qumico tiene dimensiones de energa, ya que el n
umero de
moles es adimensional.
Siendo derivadas parciales de U con respecto a S, V , N1 , . . . , Nr , la temperatura, la presion y
los potenciales qumicos son a su vez funciones de los parametros extensivos:
T

= T (S, V, N1 , . . . , Nr )

(29)

= P (S, V, N1 , . . . , Nr )

(30)

= j (S, V, N1 , . . . , Nr )

(31)

Es simple verificar que una derivada primera parcial de una funcion homogenea de orden
es a su vez una funcion homogenea de orden 1. Asi, vemos que los parametros (29)-(31) son
funciones homogeneas de orden cero de los parametros extensivos, es decir, si multiplicamos todas
las variables por una constante arbitraria , las funciones correspondientes resultan inalteradas.
Esto implica que los mismos son par
ametros intensivos. Se sigue por lo tanto que la temperatura
de cualquier porcion del sistema es igual a la del sistema completo. Esto esta en acuerdo con el
concepto intuitivo de temperatura en un sistema en equilibrio. Las mismas consideraciones podemos
hacer para la presion.
Las relaciones funcionales (29)-(31) que expresan a los parametros intensivos en funcion de
los parametros extensivos independientes del sistema se denominan ecuaciones de estado. El
conocimiento de una o algunas de las ecuaciones de estado no es suficiente para obtener la informacion completa acerca de las propiedades termodinamicas del sistema. Solo el conocimiento de
todas las ecuaciones de estado es equivalente a conocer la relacion fundamental, ya que en este
caso podemos integrar la ecuacion diferencial (24) y obtener la energa en funcion de los restantes
parametros extensivos, a menos de una constante de integraci
on irrelevante.
De la Ec.(24) vemos que los terminos relacionados con el intercambio de materia juegan un
rol similar al del trabajo mecanico. Vamos introducir entonces una notacion compacta mediante
la definicion de presiones y vol
umenes generalizados. Vamos a denotar primero los parametros
extensivos V, N1 , . . . , Nr por los smbolos X1 , X2 , . . . , Xt (t = r + 1), de manera que la relacion
fundamental (19) toma la forma
U = U (S, X1 , X2 , . . . , Xt ),

(32)

y vamos a denotar los parametros intensivos como

U
S

U
Xj

X1 ,X2 ,...

T = T (S, X1 , X2 , . . . , Xt )

(33)

Pj = Pj (S, X1 , X2 , . . . , Xt ), presiones generalizadas

(34)

S,...,Xk ,...

donde P1 = P . De esta manera


dU = T dS +

t
X
j=1

Pj dXj .

(35)

Termodinamica y Mecanica Estadstica I - Notas 2010

13

Con esta notacion, excepto la entropa y la temperatura, las restantes variables aparecen en forma
simetrica, los cual nos permitira en un futuro generalizarla facilmente para incluir variables de
sistemas mas complejos (ej., sistemas magneticos).
Vimos en el captulo anterior que la relacion fundamental entr
opica para un sistema monocomponente de N moles puede ser expresada en funcion de la entropa para 1 mol. En forma semejante
(usando la homogeneidad de la energa) puede derivarse una relacion analoga para el caso de la
relacion fundamental de un mol
u = u(s, v)

(36)

donde s = S/N , v = V /N y
1
U (S, V, N )
N

u(s, v) =

(37)

La diferencial primera de la Ec.(36) es


du =

u
u
ds +
dv.
s
v

(38)

Pero de la Ec.(37) tenemos que

u
s

=
v

1
N

U
s

=
V,N

U
S

= T.

(39)

V,N

En forma semejante

u
v

= P,

(40)

y por lo tanto
du = T ds P dv.

2.2.

(41)

Par
ametros intensivos entr
opicos

Hemos dicho que todo el formalismo termodinamico puede desarrollarse a partir de cualquiera
de las dos relaciones fundamentales equivalentes: la de la entropa o la de la energa. En la seccion
anterior introdujimos una serie de definiciones y conceptos asociados a la relacion fundamental para
la energa. Veamos el equivalente para la relacion fundamental asociada a la entropa. Adoptando
la notacion X0 U tenemos que esta toma la forma
S = S(X0 , X1 , X2 , . . . , Xt ),

(42)

cuya diferencial es
dS =

t
X
S
k=0

Xk

dXk .

(43)

Definimos entonces los par


ametros intensivos entr
opicos como
Fk

S
.
Xk

(44)

Resulta inmediato que


S
F0 =
=
U

U
S

1
T

(45)

Termodinamica y Mecanica Estadstica I - Notas 2010

14

(recordemos que S es una funcion monotona creciente de U ). Mas a


un, comparando la Ec.(43) con
la Ec.(35) (o trabajando con las propiedades de las derivadas parciales de una funcion implcita de
varias variables) se obtiene que
Pk
(k = 1, 2, . . . , t)
(46)
T
Debemos tener cuidado al trabajar con las expresiones (45) y (46). Los parametros {T, Pk }
dependen de S como variable independiente, en tanto que los parametros Fk dependen de U como
variable independiente. Dicha dependencia, el paso de una representaci
on a otra se manifiesta como
Fk =

Fk (U, X1 , . . . , Xt ) =

Pk (S(U, X1 , . . . , Xt ), X1 , . . . , Xt )
T (S(U, X1 , . . . , Xt ), X1 , . . . , Xt )

(k = 1, 2, . . . , t)

(47)

Si trabajamos utilizando la relacion fundamental (42), en que la energa es una variable independiente y S es dependiente, diremos que estamos en la representaci
on entropa. A la relacion (42)
le llamaremos la relaci
on fundamental entr
opica, a los parametros X0 , X1 , X2 , . . . , Xt le llamaremos parametros extensivos entr
opicos y al conjunto de variables F0 , F1 , . . . , Ft parametros
intensivos entr
opicos.
Si utilizamos la relacion la relacion fundamental (32) diremos que estamos en la representaci
on
energa. A la relacion (32) le llamaremos la relaci
on fundamental energ
etica, a los parametros
S, X1 , X2 , . . . , Xt le llamaremos parametros extensivos energ
eticos y al conjunto de variables
T, P1 , . . . , Pt parametros intensivos energ
eticos.
El desarrollo del formalismo termodinamico puede ser llevado a cabo en cualquiera de las representaciones, pero es conveniente, al trabajar en un problema particular, mantenerse siempre dentro
de una misma representacion, a fin de evitar confusion respecto de cuales son las variables independientes correctas.

2.3.

Equilibrio t
ermico - Temperatura

En base a las definiciones introducidas en las secciones anteriores podemos comenzar a analizar
las consecuencias del principio variacional enunciado en el postulado II, esto es, la determinacion
de los valores de equilibrio de los parametros extensivos de un sistema compuesto al remover un
vnculo interno. Comenzaremos considerando un sistema al cual removemos el vnculo restrictivo
respecto de la transferencia de calor, esto es, un sistema compuesto por dos subsistemas separados
por una pared rgida, impermeable pero diat
ermica. Los n
umeros de moles y los vol
umenes
de cada susbsistemas permanecen inalterados, pero tendremos una redistribucion de los valores de
U (1) y U (2) sujetos a la restriccion
U (1) + U (2) = cte

(48)

impuesta por el hecho de que el sistema total se encuentra completamente aislado del exterior. De
acuerdo con el segundo postulado, una vez que el sistema alcanza el equilibrio los valores de U (1) y
U (2) son aquellos que maximizan la entropa del sistema compuesto no interactuante, sujetos a la
restriccion (48). Si la entropa posee un extremo para estos valores entonces se cumple que
dS = 0

(49)

(podramos igualmente anular las derivadas parciales de S, pero en este caso tendramos que introducir un multiplicador de Lagrange para tomar en cuenta el vnculo (48); ambos procedimientos
son equivalentes). La entropa del sistema compuesto viene dada por
(1)

(2)

S = S (1) (U (1) , V (1) , N1 , . . . , Nr(1) ) + S (2) (U (2) , V (2) , N1 , . . . , Nr(1) )

(50)

Termodinamica y Mecanica Estadstica I - Notas 2010

15

Para un cambio infinitesimal en U (1) y U (2) tenemos que

dS =

S (1)
U (1)

dU

(1)

(1)

V (1) ,...,Nj ,...

S (2)
U (2)

dU (2)

(51)

(2)

V (2) ,...,Nj ,...

o usando la definicion de temperatura


dS =

1
1
dU (1) + (2) dU (2) .
T (1)
T

(52)

Del vnculo (48) tenemos que


dU (1) = dU (2)

(53)

y por lo tanto

dS =

1
T (1)

dU (1) .

T (2)

(54)

De la condicion de extermo dS debe anularse para variaciones arbitrarias de dU (1) . Asi, la condicion
de equilibrio resulta
1

(55)
T (2)
esto es, la condicion de equilibrio termico es que las temperaturas de ambos subsistemas se igualen
T (1) = T (2) . Notemos que la Ec.(55) esta expresada en funcion de las inversas de las temperaturas.
Esto es para enfatizar el hecho de que estamos trabajando en la representaci
on entropa, en la
cual 1/T es funcion de U, V, N1 , . . . , Nr . De esta manera, si las relaciones fundamentales S =
S(U, V, N1 , . . . , Nr ) son conocidas para cada subsistema, las inversas de las temperaturas pueden
calcularse en funcion de las mismas variables independientes. Asi, las Ecs.(55) y (48) constituyen un
sistema de dos ecuaciones en las incognitas U (1) y U (2) , las cuales pueden eliminarse, resolviendose
asi en principio el problema basico de la termodinamica para este caso particular. No obstante,
para que el problema este completamente resuelto debemos determinar que tipo de extremo hemos
calculado. La condicion de maximo requiere que ademas de la condicion dS = 0 debe cumplirse que
T (1)

d2 S < 0.
Las consecuencias de esta condicion nos llevan a plantear la cuestion de estabilidad, la cual sera analizada mas adelante.
Hemos visto entonces que, si dos sistemas son separados por una pared diatermica, tendremos un
flujo de calor hasta que las temperaturas se equiparen. Analicemos esto en mas detalle. Supongamos
que tenemos dos sistemas muy parecidos (pero no identicos) inicialmente separados por una pared
adiabatica. Esto es, ambos sistemas tienen inicialmente temperaturas levemente diferentes:
T (1) > T (2) .

(56)

Si ahora el vnculo adiabatico es removido, el sistema no se encuentra mas en equilibrio, tendremos


un flujo de calor a traves de la pared y la entropa total se incrementar
a. Si denotamos por S la
diferencia entre las entropas final e inicial, tendremos que
S > 0.
Usando la Ec.(54) podemos aproximar

1
T (1)

1
T (2)

U (1) > 0,

(57)

Termodinamica y Mecanica Estadstica I - Notas 2010

16

ya que |U (1) | 1. De la Ec.(56) tenemos entonces que U (1) < 0, esto es, el sistema 2 aumenta
su energa a expensas del sistema 1. Esto significa que el proceso espontaneo que ocurre al remover
el vnculo es tal que el calor fluye del sistema a mayor temperatura 1 al del menor temperatura 2.
Este es precisamente el postulado tradicional de Clausius de la segunda ley de la termodinamica.
Este resultado conjuntamente con el hecho de que T sea una variable intensiva (lo cual implica que
la temperatura de cualquier porcion de un sistema en equilibrio es igual a la del sistema completo)
fundamenta fsicamente la definicion formal de temperatura (21).
2.3.1.

Unidades de temperatura

La temperatura que hemos definido tiene dimensiones de energa/entropa. Sin embargo, la


entropa no tiene dimensiones bien definidas. Siendo que la entropa fue definida a traves de un
principio variacional, si la multiplicamos por una constante positiva obtendremos una nueva entropa, con dimensiones diferentes pero con las mismas propiedades extremales y por lo tanto con
la misma informacion fsica sobre el sistema. La manera mas simple de resolver esta arbitrariedad
es asumir convencionalmente una entropa adimensional. Consecuentemente, la temperatura
tendra dimensiones de energa. No obstante, resulta conveniente medir la temperatura con un
sistema de unidades propio (diferente de las unidades tpicas de Joule, erg, calorias, etc).
A medida que desarrollemos las consecuencias de los postulados de la termodinamica veremos
que de los mismos se deduce que la eficiencia
optima (esto es, el cociente entre el trabajo neto
realizado y el calor empleado para producirlo) de una maquina termica ideal en contacto con dos
fuentes de temperatura T1 > T2 viene dada por
=1

T2
T1

Vemos entonces que los principios de la termodin


amica proveen un metodo que determina unvocamente el cociente entre las temperaturas de dos sistemas cualesquiera.
El hecho de que el cociente entre dos temperaturas cualesquiera sea una cantidad directamente
medible tiene consecuencias importantes. El cero de temperatura queda unvocamente determinado
y no puede ser asignado arbitrariamente a un estado de referencia, como ocurre con la energa.
Esto, por otra parte, resulta consistente con el hecho de que la temperatura sea no-negativa (temperaturas negativas daran una eficiencia > 1). Por otra parte, las unidades de temperatura s son
arbitrarias, ya que podemos asignar un valor arbitrario a un estado de referencia y la escala queda
completamente determinada. No obstante, las diferentes escalas que resultan de asignar el valor
unidad a diferentes sistemas de referencia conciden todas en T = 0.
En el Sistema Internacional de unidades se utiliza la escala Kelvin, en la cual se asigna el valor
273.16 a la temperatura de una mezcla de agua, hielo y vapor en equilibrio; veremos mas adelante
que este estado del agua (conocido como punto triple) ocurre a una temperatura u
nica. La unidad de
o
temperatura se denomina grado Kelvin y se denota con K. El factor de conversi
on (adimensional)
entre Joule y Kelvin se conoce como constante de Boltzmann: kB = R/NA = 1,3806 Joule/Kelvin,
donde R es la llamada constante universal de los gases y NA es el n
umero de Avogadro . La
escala Celsius (o C) de uso cotidiano se relaciona con la escala Kelvin por
T (o C) = T (K) 273,15
Conviene recalcar que esta escala no es una escala termodin
amica, ya que el cero de temperatura
esta corrido, de manera que la razon de temperaturas expresada en grados Celsius no esta en
acuerdo con los principios termodinamicos. Esta escala se construye asignando el valor cero al
punto de fusion del agua a la presion de 1 atm y el valor 100 al punto de evaporacion a la misma
presion. El orgen de esta escala es previo al desarrollo de la termodinamica y a la compresion de
que el cero de temperatura es u
nico. En esa epoca (Celsius, 1742) se pensaba que era necesarios

Termodinamica y Mecanica Estadstica I - Notas 2010

17

asignar dos valores arbitrarios a sistemas de referencia, en lugar de uno, para definir una escala de
temperatura. De hecho, el valor 273.16 asignado al punto triple del agua en la escala Kelvin resulta
de que la escala Celsius ya era de uso en la epoca de Kelvin.

2.4.

Equilibrio mec
anico

Supongamos ahora dos subsistemas separados por una pared impermeable, diat
ermica y
movil. Los n
umeros de moles permanecen constantes, pero los valores de U (1) y U (2) , asi como los
valores de V (1) y V (2) se redistribuyen sujetos a los vnculos:
U (1) + U (2) = cte

(58)

V (1) + V (2) = cte

(59)

Para variaciones infinitesimales en las variables independientes la variaci


on de S viene dada en este
caso por:

dS =

S (1)
U (1)
S (2)
U (2)

dU
!

(1) ,...,N (1) ,...


j

dU
V

(1)

(2)

(2) ,...,N (2) ,...


j

S (1)
V (1)
S (2)
V (2)

dV (1) +

(60)

dV (2) .

(61)

(1)
U (1) ,...,Nj ,...

(2)
U (2) ,...,Nj ,...

De las condiciones (58) y (59) tenemos que


dU (1) = dU (2)
(1)

dV

(62)

(2)

= dV

(63)

y por lo tanto

dS =

1
T (1)

1
T (2)

dU

(1)

P (1) P (2)
(2)
T (1)
T

dV (1) = 0.

(64)

Dado que esta expresion debe anularse para valores arbitrarios e independientes de dU (1) y dV (1)
tenemos que
1
T (1)
P (1)
T (1)

=
=

1
T (2)
P (2)
T (2)

(65)
(66)

Nuevamente, dado que estamos en la respresentaci


on entropa, la resolucion de estas ecuaciones
conjuntamente con (58) y (59) nos dan los valores de equilibrio de U (1) , U (2) , V (1) y V (2) . No
obstante, fsicamente elles implican la igualdad de las temperaturas y presiones:
T (1) = T (2)
P

(1)

= P

(2)

(67)
.

(68)

Termodinamica y Mecanica Estadstica I - Notas 2010

18

La igualdad de las temperaturas es el resultado previamente obtenido para una pared diatermica.
Permitir que la pared sea movil introduce el hecho nuevo de la igualdad de las presiones, lo cual
corrobora la identificacion de P con la presion mecanica.
El problema de una pared adiab
atica y movil no posee solucion desde la termodinamica.
Los cambios de vol
umenes producidos al moverse la pared producen intercambios de trabajo entre
ambos subsistemas que alteran las correspondientes energas internas. En el caso anterior de una
pared diatermica las energas se alteran tambien por un intercambio de calor que no conocemos
a priori. Sin embargo, en el caso de una pared adiabatica las variaciones de energa interna se
corresponden exactamente con el intercambio de trabajo, esto es
dU (1) = P (1) dV (1)
dU

(2)

= P

(2)

dV

(2)

(69)
.

(70)

Combinando estas ecuaciones con las condiciones (58) y (59) se obtiene la igualdad de las presiones,
exclusivamente de la conservacion de la energa. Si reemplazamos este resultado en la expresion de
dS (64) vemos que la misma se satisface identicamente y las temperaturas de equilibrio quedan indeterminadas. En otras palabras, al dejar de ser independientes las variaciones de energa y vol
umen
perdemos una de las cuatro ecuaciones independientes que necesitamos para resolver las cuatro
variables U (1) , U (2) , V (1) y V (2) . Fsicamente esto resulta del hecho que al no haber transferencia
de calor, lo que tenemos es equivalente a un sistema mec
anico. Asi, a menos que las presiones iniciales sean iguales, esperaramos que el piston comience a oscilar al liberar el vnculo y por lo tanto
el sistema nunca alcanzara el equilibrio. No obstante, esto no ocurre, ya que los fluidos presentan
viscosidad, la cual amortigua el movimiento, ya que el piston disipa energa en su movimiento,
la cual se transfiere a los subsistemas y el sistema alcanza eventualmente el equilibrio cuando las
presiones se igualan y las temperaturas finales van a depender de las viscosidades relativas. Sin
embargo, la solucion de este problema depende de consideraciones din
amicas, que se encuentran
fuera del alcance de la termodinamica.

2.5.

Equilibrio con respecto al intercambio de materia (difusi


on)

Consideremos ahora el caso de una pared rgida y diat


ermica, la cual es permeable a la
componente qumica asociada a N1 e impermeable a todas las demas. El cambio en la entropa
total es entonces:
dS =

(1)

1
T

dU (1)
(1)

(2)

1
1

(1)
(2)
dN1 + (2) dU (2) 1(2) dN1
(1)
T
T
T

(71)

sujeto a las condiciones


dU (1) = dU (2)
(1)
dN1

(72)

(2)
dN1 ,

(73)

de donde

dS =

1
T (1)

1
T (2)

(2)

dU

(1)

Las condiciones de equilibrio resultan entonces

(1)

1
T (2) T (1)

!
(1)

dN1

= 0.

(74)

Termodinamica y Mecanica Estadstica I - Notas 2010

T (1)
(1)

1
T (1)

1
T (2)
(2)
1
T (2)

19

(75)
(76)

o bien
T (1) = T (2)

(77)

(1)
1

(78)

(2)
1 .

De esta condicion de equilibrio vemos el origen del nombre de , ya que el mismo actua como
una especie de potencial para el flujo de materia: diferencias en el potencial qumico actuan
como fuerzas generalizadas. La direccion de este flujo puede ser calculada a traves del mismo analisis
utilizado para el calor. Si suponemos que ambos subsistemas estan a la misma temperatura, tenemos
de la Ec.(74)
(2)

dS =
(1)

(2)

(1)

1 1
(1)
dN1 .
T

(79)

(1)

Si 1 > 1 entonces dN1 < 0 ya que dS tiene que ser positivo. Por lo tanto la materia fluye de
las regiones de mayor a las de menor potencial qumico.

2.6.

Equilibrio qumico

Las mezclas de sustancias que pueden sufrir reacciones qumicas presentan un problema analogo
al de difusion presentado en la subseccion anterior. En ambos casos las condiciones de equilibrio
se expresan en terminos del potencial qumico , de lo cual deriva su nombre. A diferencia del
caso anterior, los n
umeros de moles de cada componente reactiva en este caso no se mantienen
constantes, aumentando unos a expensas de otros. La relacion entre dichos cambios esta gobernada
por relaciones qumicas del tipo
2 H2 + O2 *
) 2 H2 O

(80)

El significado de esta ecuacion es que los cambios en los n


umeros molares del hidrogeno, oxgeno
y agua se establecen en una relacion -2: -1: +2 (se necesitan dos moles de H2 y uno de O2 para
constituir 2 de H2 O, o viceversa). Para el caso general de r componentes reactivas, estas relaciones
se expresan en la forma
r
X

j Aj *
)0

(81)

j=1

donde los j se definen como los coeficientes estequiometricos (-2,-1 y +2 para la reaccion anterior
y los Aj son los smbolos para las componentes qumicas (A1 = H2 , A2 = O2 y A3 = H2 O
para la reaccion anterior). De esta manera, los cambios en los n
umeros molares al final de esta
tranformacion tienen que satisfacer la proporcionalidad
N1
N2
Nr
=
= =
1
2
r

(82)

donde Nj = Njf inal Njinicial . El cambio en entropa para una variaci


on infinitesimal en los
n
umeros de moles en una reaccion qumica viene dado por

Termodinamica y Mecanica Estadstica I - Notas 2010

dS =

r
X
j
j=1

20

dNj

(83)

donde ya hemos asumido el equilibrio termico. De la Ec.(82), tenemos que los dNj deben satisfacer la
misma proporcionalidad dNj = j d, donde d es el coeficiente de proporcionalidad. Reemplazando
en (83) tenemos
dS =

r
d X
j j
T j=1

(84)

de donde la condicion de equilibrio qumico es


r
X

j j = 0

(85)

j=1

Dados los n
umeros de moles iniciales de todas las componentes, esta ecuacion conjuntamente
con las r 1 ecuaciones independientes (proporcionalidad) permite despejar los r n
umeros de moles
finales en equilibrio.

Termodinamica y Mecanica Estadstica I - Notas 2010

3.

21

Relaciones formales

Vamos a ver ahora varias propiedades matematicas importantes que se deducen de la homogeneidad de las relaciones fundamentales.

3.1.

La ecuaci
on de Euler

Tenemos que
U (S, X1 , . . . , Xt ) = U (S, X1 , . . . , Xt ).

(86)

t
X
U (. . . , Xk , . . .)
U (. . . , Xk , . . .)
S+
Xj = U (S, X1 , . . . , Xt )
(S)
(Xj )
j=1

(87)

Derivando respecto de

Dado que esta ecuacion es valida para valores arbitrarios de podemos tomar = 1, en cuyo caso
toma la forma
t
X
U
U
Xj = U
S+
S
X
j
j=1

(88)

es decir,
U = TS +

t
X

Pj Xj .

(89)

j=1

Para un sistema simple particular tenemos que


U = T S P V + 1 N1 + + r Nr .

(90)

La Ec.(90) es conocida como ecuaci


on de Euler. En la representaci
on entropa la ecuacion de
Euler toma la forma

S=

1
T

U+

P
T

r
X
j
j=1

Nj .

(91)

Notemos que si conocemos las ecuaciones de estado, esto es, si conocemos T , P , {j } (en la
representacion energa) como funcion de S, V , {Nj }, podemos reconstruir la relacion fundamental
simplemente reemplazando en la Ec.(90), sin necesidad de integrar una ecuacion diferencial.

3.2.

La relaci
on de Gibbs-Duhem

Una de las consecuencias importantes de la homogeneidad de la relacion fundamental es que los


parametros intensivos de cualquier sistema no son todos independientes entre s. Tomemos
por ejemplo un sistema simple monocomponente. Los tres parametros intensivos T , P y son
funciones de S, V y N . No obstante, como los parametros intensivos son funciones homogeneas de
orden cero de los extensivos (una consecuencia directa de la homogeneidad de primer orden de U ),
tenemos que
T

= T (S, V, N ) = T (S/N, V /N, 1) = T (s, v)

(92)

= P (S, V, N ) = P (S/N, V /N, 1) = P (s, v)

(93)

= (S, V, N ) = (S/N, V /N, 1) = (s, v).

(94)

Termodinamica y Mecanica Estadstica I - Notas 2010

22

De esta manera, podemos despejar s y v en funcion de dos cualesquiera de ellos y reemplazar en


el tercero. Asi, por ejemplo, podramos expresar = (T, P ). Este resultado puede extenderse
facilmente a un caso completamente general. Supongamos que tenemos una relacion fundamental
de t + 1 variables extensivas:
U = U (S, X1 , . . . , Xt )

(95)

la cual genera t + 1 ecuaciones de estado


T

= T (S, X1 , . . . , Xt )

(96)

Pj

= Pj (S, X1 , . . . , Xt )

j = 1, . . . , t.

(97)

Eligiendo = 1/Xt en la Ec.(86) tenemos


T

= T (S/Xt , X1 /Xt , . . . , Xt1 /Xt , 1)

Pj

= Pj (S/Xt , X1 /Xt , . . . , Xt1 /Xt , 1)

(98)
j = 1, . . . , t.

(99)

Cada uno de los t + 1 parametros intensivos es entonces funcion de solo t variables independientes.
Eliminando estas t variables entre las t + 1 ecuaciones nos permite encontrar una relacion entre los
t + 1 parametros intensivos.
Encontrar explcitamente la relacion funcional que existe entre los parametros intensivos requiere
el conocimiento de la relacion fundamental. Por lo tanto, esta relacion funcional depende del sistema
particular. No obstante, es posible encontrar una forma diferencial de esta relacion completamente
general, a partir de la ecuacion de Euler. Tomando una variaci
on infinitesimal de la Ec.(89) tenemos
que
dU = T dS + SdT +

t
X

Pj dXj +

j=1

t
X

Xj dPj ,

(100)

j=1

pero sabemos que


dU = T dS +

t
X

Pj dXj .

(101)

j=1

Restando estas dos ecuaciones obtenemos la relaci


on de Gibbs-Duhem:
SdT +

t
X

Xj dPj = 0.

(102)

j=1

Para un sistema simple mono componente tenemos que


SdT V dP + N d = 0

(103)

d = sdT + vdP

(104)

o bien

es decir, las variaciones del potencial qumico, la temperatura y la presion no son independientes.
El n
umero de parametros intensivos independientes de un sistema se conoce como los grados de
libertad termodin
amicos. Un sistema simple de r componentes tiene r + 1 grados de libertad.
En la representacion entropa la relacion de Gibbs-Duhem toma la forma

Termodinamica y Mecanica Estadstica I - Notas 2010

t
X

23

Xj dFj = 0.

(105)

j=0

1
Ud
T

3.3.

P
+Vd
T

r
X

Nj d
T
j=1

= 0.

(106)

Resumen de la estructura formal de la termodin


amica

Por simplicidad consideremos la representaci


on energa de un sistema simple mono componente,
cuya relacion fundamental es
U = U (S, V, N )
la cual contiene toda la informacion termodinamica del sistema. Derivando esta relacion obtenemos
las tres ecuaciones de estado:
T

= T (S, V, N ) = T (s, v)

(107)

= P (S, V, N ) = P (s, v)

(108)

= (S, V, N ) = (s, v).

(109)

Si conocemos las tres ecuaciones de estado podemos recuperar la relacion fundamental reemplazando en la ecuacion de Euler. Por lo tanto las tres ecuaciones de estado son equivalentes a
la relacion fundamental. Cualquier ecuacion de estado aislada contiene menos informacion termodinamica que la relacion fundamental.
Si conocemos solo dos ecuaciones de estado podemos encontrar la tercera integrando la relacion
de Gibbs-Duhem, a menos de una constante de integraci
on. Asi, el conocimiento de dos de las
ecuaciones de estado nos permite conocer la relacion fundamental a menos de una constante indeterminada.
Si conocemos T (s, v) y P (s, v) una manera mas directa de obtener la relacion fundamental es
integrar directamente la relacion molar
du = T ds P dv

(110)

lo cual nos permite obtener la relacion fundamental u = u(s, v) a menos de una constante de
integracion.
Siempre es posible expresar U en funcion otros parametros. Asi, por ejemplo, de la ecuacion de
estado T = T (S, V, N ) podemos despejar S como funcion de T , V y N y reemplazarla en la relacion
fundamental. De esta manera obtendramos una relacion U = U (T, V, N ). No obstante, esta no es
una relaci
on fundamental y por lo tanto no contiene toda la informacion termodinamica. Esto
se ve en el hecho de que si disponemos de la relacion U = U (T, V, N ) no podemos reconstruir de
manera completa la relacion U = U (S, V, N ). Si recordamos que T = U
on U = U (T, V, N )
S , la relaci
es en realidad una ecuacion diferencial en derivadas parciales. Si tomamos V y N como constantes,
podemos pensar esta como una ecuacion diferencial ordinaria de la forma y = F (dy/dx) e integrarla.
No obstante, esta solucion va a contener una constante indeterminada. Podemos pensar que esto no
es importante, ya que la energa esta siempre determinada a menos de una constante. No obstante,
esta constante de integracion lo es con respecto a S (la variable de integraci
on), pero es en
principio una funci
on de V y N . De esta manera, estaramos perdiendo informacion acerca de la
dependencia de U con V y N .

Termodinamica y Mecanica Estadstica I - Notas 2010

24

Notemos que los grados de libertad termodinamicos nos dan el n


umero de variables de estado
independientes del sistema, ya sean extensivos o intensivos. Asi, por ejemplo, en un sistema simple
monocomponente tenemos dos grados de libertad. A partir de las ecuaciones de estado T = T (s, v) y
P = P (s, v) podemos siempre expresar dos cualesquiera de las cuatro variables T, P, s, v en funcion
de las dos restantes, las cuales son variadas independientemente.

3.4.

Funciones respuesta

Se denominan funciones respuesta a cantidades que nos dan informacion acerca de como cambia
una variable de estado especfica en respuesta a cambios en otras variables de estado independientes bajo condiciones controladas. Estas funciones son de gran importancia, ya que resultan las
mas accesibles experimentalmente, y estan todas relacionadas a derivadas segundas de la relacion
fundamental.
Entre las funciones respuesta mas usadas se encuentran los calores especficos definidos como
0
dQ

1
CY
N

dT

(111)

que representan la cantidad de calor tranferida por unidad de incremento de temperatura a un


mol de la sustancia, en un proceso cuasi-estatico en el cual la variable de estado Y se mantiene
constante. Asi, por ejemplo, para un sistema simple monocomponente resultan de interes los calores
especficos a volumen constante Cv y a presi
on constante Cp . Para calcular Cv podemos utilizar la
ecuacion de estado molar s = s(T, v). Tenemos que

ds =
De la ecuacion T dS = d0 Q T ds =

s
T

1 0
Nd Q

dT +
v

s
v

dv.

(112)

tenemos que

Cv = T

s
T

T
N

=
v

S
T

(113)

De la misma manera podemos obtener a partir de la ecuacion de estado s = s(T, P )

Cp = T

s
T

T
=
N

S
T

(114)

Notemos que, por ejemplo,

S
T

=
V

T
S

=
V

2U
S 2

!1

(115)

Otras funciones respuesta de interes para sistemas simples son las compresibilidades:
1
Y
v

v
P

1
=
V

V
P

(116)
Y

que nos dan el decremento relativo del volumen molar por unidad de incremento de la presion en
un proceso cuasi-estatico a Y constante. Asi tenemos la compresibililidad isotermica
1
T
v

v
P

(117)
T

y la compresibililidad adiab
atica
s

1
v

v
P

.
s

(118)

Termodinamica y Mecanica Estadstica I - Notas 2010

25

El coeficiente de expansi
on t
ermica se define como
1

v
T

1
=
V

V
T

1
=

(119)
P

que nos dan el incremento relativo del volumen molar (o el decremento de la densidad) por unidad
de incremento de temperatura en sistema mantenido a presion constante.
Estas funciones no son independiantes entre s.. Esto surge del hecho de que todas ellas estan
relacionadas con derivadas segundas de la relacion fundamental. Tomemos un ejemplo simple. La
identidad

T
V

=
S,N

P
S

(120)
V,N

surge de la propiedad

U
S

U
V

(121)

Las dos cantidades que aparecen en la Ec.(120) tienen un significado fsico directo y pueden ser
medidas. La cantidad del lado izquierdo de la ecuacion nos da el cambio de temperatura
asociado

a una expansion adiabatica; la cantidad del lado derecho puede ser reescrita como T ddP
, la
0Q
V,N

cual es proporcional al cambio de presion asociado con la introduccion de una cantidad d0 Q de calor
en un sistema mantenido a volumen constante. La prediccion de la igualdad de estas dos cantidades
aparentemente no relacionadas entre s es un resultado no trivial y permite poner a prueba la teora.
Mediante una derivacion un poco mas complicada (que veremos mas adelante) pueden demostrarse las siguientes relaciones entre las funciones respuesta definidas anteriormente para un
sistema simple:
T V 2
N T
T V 2
= s +
N Cp

Cp = Cv +

(122)

(123)

Vemos asi que de las cinco funciones solo tres son independientes. Habitualmente se tabulan
Cp , y T como funcion de T y P para sistemas simples monocomponentes. Ahora bien, siendo las
funciones respuesta derivadas primeras de variables de estado con respecto a otras, conociendolas
podemos en principio calcular ecuaciones de estado mediante integraci
on. Por ejemplo, podemos
calcular la ecuacion de estado v = v(T, P ) de la siguiente manera. Tenemos que

v
v
dv =
dP +
P T
T
= v T dP + v dT

dT.

(124)

(125)

dv
= d(ln v) = T (T, P )dP + (T, P )dT
(126)
v
Ahora bien, siendo v una variable de estado, tambien lo es su logaritmo y por lo tanto la integral
entre dos punto arbitrarios no depende del camino de integraci
on. Podemos entonces obtener el
valor de v para un punto arbitrario (T, P ) integrando en un camino que va desde un punto (T0 , P0 ),
primero a presion constante P0 desde T0 hasta T y luego a temperatura constante T desde P0 hasta
P (ver figura 3). Asi

Termodinamica y Mecanica Estadstica I - Notas 2010

26

P0

T0

Figura 3:

ln

v
=
v0

Z T
T0

(T 0 , P0 )dT 0

Z P
P0

(T, P 0 )dP 0 .

(127)

Si conocemos el valor de v0 en el punto de referencia (T0 , P0 ) podemos entonces reconstruir la


ecuacion de estado v = v(T, P ).

Termodinamica y Mecanica Estadstica I - Notas 2016

4.

27

Ejemplos de sistemas termodin


amicos
Veremos algunos ejemplos de diferentes sistemas termodinamicos y sus ecuaciones de estado.

4.1.
4.1.1.

Gases ideales
Gases ideal monocomponente

El gas ideal monocomponente esta caracterizado por las ecuaciones de estado


PV
U

= N RT

(128)

= cN RT

(129)

donde c es una constante que depende del tipo de gas y R es llamada la constante universal de los
gases (R = NA kB = 8,3144J/K = 1,986 cal/K). Estas ecuaciones pueden derivarse empricamente
o a traves de la teora cinetica de los gases, considerando un gas compuesto por partculas puntuales
no interactuantes. Estas ecuaciones son satisfechas en una buena aproximaci
on por muchos gases a
bajas densidades. Para gases monoatomicos no interactuantes (He, Ar, Ne, etc) estas ecuaciones se
satisfacen para un rango amplio de temperaturas y presiones moderadas con c = 3/2. Para gases
diatomicos, se satisfacen para un rango mas limitado de temperaturas con c 5/2, aunque para
otro rango de temperaturas mayores (para el mismo gas) satisface c 7/2.
A partir de las ecuaciones de estado podemos calcular la relacion fundamental. Dado que U
aparece explcitamente, resulta conveniente trabajar en la representaci
on entropa, en la cual toman
la forma:
1
T
P
T

N
cR
=
U
u
N
R
= R = .
V
v
= cR

(130)
(131)

A partir de estas dos ecuaciones podemos obtener la tercera /T en funcion de u y v integrando la


relacion de Gibbs-Duhem

= ud

1
T

+ vd

P
T

(132)

A continuaci
on deberamos expresar en la Ec.(132) las variables u y v en funcion de (1/T ) y (P/T );
una vez integrada la ecuacion obtendramos (/T ) en funcion de estas u
ltimas variables, de la cual
reemplazando las Ecs.(130) y (131) obtendramos la relacion buscada. No obstante podemos acortar
camino y transformar la Ec.(132) en una ecuacion en las variables u y v en lugar de (1/T ) y (P/T )
diferenciando las ecuaciones (130) y (131). Asi

d
T

cR
R
= u 2 du + v 2 dv
u
v
cR
R
= du dv
u
v
= R d (c ln u + ln v) .

(133)
(134)
(135)

Asi

= cR ln
0

u
u0

R ln

v
.
v0

(136)

Termodinamica y Mecanica Estadstica I - Notas 2016

28

donde (u0 , v0 ) es un estado de referencia. Reemplazando esta ecuacion de estado en la ecuacion de


Euler obtenemos

P
T

S =
U+
V
N
T



u
v

= N (c + 1)R + cRN ln
+ RN ln
N
u0
v0
T 0
c
u
v
= N s0 + N R ln
u0
v0
1
T

(137)
(138)
(139)

donde

s0 = (c + 1)R

.
0

Dado que u = U/N y u0 = U0 /N0 tenemos finalmente


"

S = N s0 + N R ln

U
U0

V
V0

N
N0

(c+1) #

(140)

Si la constante s0 fuera conocida tendramos la informacion termodinamica completa del sistema.


Alternativamente, podemos integrar la ecuacion molar

ds =

1
T

du +

P
T

dv =

cR
R
du + dv
u
v

(141)

de donde se obtiene el mismo resultado.


De la Ec.(129) tenemos que
U
T N
=
.
U0
T0 N0
Reemplazando esta expresion en la relacion (140) podemos escribir la entropa como
S = N s0 + cN R ln

V
T
+ N R ln
T0
N v0

(142)

Esta ecuacion de estado, conjuntamente con la Ec.(129) contienen la misma informacion que la
relacion fundamental (140).
4.1.2.

Gas ideal multicomponente

Una mezcla de dos o mas gases ideales no interactuantes se conoce como el gas ideal multicomponente. Dado que los gases no interact
uan entre s y dado que la energa de un gas ideal
simple es independiente del vol
umen, tenemos que la energa total sera simplemente la suma de las
energas internas que tendran las componentes de la mezcla aisladas a la misma temperatura, esto
es

X
U = cj Nj RT .

(143)

Una segunda ecuacion de estado para este sistema se obtiene a partir de lo que se conoce como
Teorema de Gibbs: la entropa de una mezcla de gases ideales es la suma de las entropas que
cada gas tendra si individualmente ocupara el mismo volumen V a la misma temperatura T . Asi,
usando la expresion (142) tenemos

Termodinamica y Mecanica Estadstica I - Notas 2016

S=

29

X
X
T
Nj sj0 + cj Nj R ln
+
Nj R ln

T0

V
Nj v0

(144)

Reemplazando la Ec.(143) en la (144) obtenemos la relacion fundamental

S(U, V, N1 , . . . , Nr ) =

X
Nj sj0 + cj Nj R ln

RT0

j cj Nj

Nj R ln

V
Nj v0

(145)

Este llamado teorema puede derivarse desde la teora cinetica de los gases y se comprueba
experimentalmente. De la teora cinetica se obtiene considerando que la presion total sobre las
paredes resulta de la suma de las presiones que cada gas ejerce individualmente, dado que estos no
interact
uan entre s. De esta manera, la presi
on parcial ejercida por la componente j viene dada
por Pj = Nj RT /V (esta presiones parciales solo tienen sentido fsico en la mecanica estadstica de
gases ideales; desde el punto de vista macroscopico son solo entidades formales). La presion de la
mezcla viene entonces dada por
P =

Pj .

(146)

Integrando esta ecuacion de estado junto con la Ec.(143) y asumiendo que en el estado de referencia
los n
umeros molares son iguales que en el estado final, se obtiene la expresion (144).
Resulta tambien interesante reescribir la Ec.(144) de la siguiente forma

S=

X
j

donde N =

P
j

Nj sj0 +

cj Nj R ln

X
T
V
Nj
+ N R ln
R
Nj ln
T0
N v0
N
j

(147)

Nj . El u
ltimo termino en la Ec.(147) se conoce como entropa de mezcla:
Smez = R

X
j

Nj ln

Nj
.
N

(148)

Comparando con la Ec.(142) puede interpretarse como sigue: la entropa de mezcla representa la
diferencia entre las entropas de una mezcla de gases y la correspondiente a una colecci
on de gases
separados a la misma temperatura y a la misma densidad que la mezcla original Nj /Vj = N/V .
Notemos que Smez 0 , con lo cual la entropa de la mezcla es siempre mayor que la de los gases
separados.
Imaginemos la siguiente situacion. Dividamos el volumen V en un conjunto de camaras inicialmente aisladas entre s, cada una de volumen Vj y conteniendo uno de los gases de la mezcla; los
vol
umenes Vj son elegidos de manera que Nj /Vj = N/V j Las paredes de las camaras pueden
pensarse diatermicas, de manera que incialmente todos los gases se encuentran a la misma temperatura. Si ahora removemos el vnculo los gases se mezclan y la entropa aumenta, lo cual es
consistente con la idea de entropa como una medida del desorden. No obstante, notemos que la
entropa de mezcla no contiene ninguna referencia al tipo de gas que contiene cada camara. En
particular, incluye el caso en que cada camara esta llena con el mismo gas, es decir, con gases
compuestos por partculas indenticas. En este caso, la idea de mezcla pierde sentido y la entropa
no debera cambiar, en contradiccion con lo predicho por la Ec.(147). Este hecho fue reconocido
por primera vez por Gibbs y se conoce como paradoja de Gibbs. Evidentemente, lo que ocurre
es que la expresion (147) es incorrecta en el caso de una mezcla de gases identicos.

Termodinamica y Mecanica Estadstica I - Notas 2016

4.2.

30

El desarrollo del virial

Los gases reales solo satisfacen las ecuaciones de los gases ideales para densidades bajas y altas
temperaturas. En particular a bajas temperaturas y altas presiones, sabemos que la mayora de los
gases condensan, con lo cual ocurre un fuerte desvo del comportamiento ideal. Esto es bastante
intuitivo, ya que en esas condiciones las interacciones entre las moleculas seran importantes. Una
correcion a la ecuacion de estado del gas ideal (128), de importancia experimental, se conoce como
el desarrollo del virial:

P =

N RT
V

"

N
1 + B(T ) +
V

N
V

C(T ) + .

(149)

Los coeficientes B(T ), C(T ), etc, son funciones u


nicamente de T y se conocen como coeficientes
del virial. Estos coeficientes pueden ser calculados desde la mecanica estadstica para diferentes
potenciales interatomicos. La comparacion entre los valores predichos teoricamente y los medidos
experimentalmente es un metodo importante para la determinacion de potenciales interat
omicos
particulares. Notemos que este es un desarrollo en serie de potencias de P en la densidad, donde el
termino de orden cero corresponde al gas ideal.

4.3.

El fluido ideal de van der Waals

Este es un modelo fenomenologico introducido por van der Waals en 1873, como un intento de
describir el comportamiento de gases reales, especialmente a bajas temperaturas, en la region de
la transicion lquido-gas. De hecho, el mayor interes de este modelo es que constituyo la primera
teora fenomenologica que describe correctamente, al menos en forma cualitativa, dicho fenomeno.
El modelo se plantea como una correcion a la ecuacion de estado del gas ideal (128). A bajas densidades las partculas en un gas pueden considerarse como partculas puntuales no interactuantes.
A altas densidades estas consideraciones pierden validez.
La primera correcion consiste entonces en asignarles a las partculas un volumen finito b/NA
y restar al volumen total V el volumen total ocupado por las partculas. Asi, el volumen se
reemplaza en la ecuacion (128) por V V N b o bien v v b (b se conoce como el
volumen excluido).
La siguiente correccion se basa en la existencia de fuerzas entre las partculas. Una partcula
en el interior del volumen sentira las fuerzas ejercidas por las restantes partculas en todas
las direcciones, las cuales en promedio tenderan a cancelarse. No obstante, para una partcula
que se aproxima a una pared existira un desbalance de fuerzas, sintiendo una fuerza neta
contraria a la direccion de la pared. Dado que la presion sobre las paredes del recipiente surge
como resultado de los choques de las partculas contra las mismas, este desbalance de fuerzas
tendera a disminuir la presion. Esta disminuci
on en la presion sera proporcional a n
umero
de pares de partculas interactuantes y por lo tanto proporcional al cuadrado de la densidad.
Asi, la correcion consiste en restar a la presion un termino proporcional a 1/v 2 .
Estas consideraciones llevan a la ecuaci
on de estado de van der Waals:
a
RT
2
(150)
vb v
Las constantes a y b pueden considerarse como constantes fenomenologicas, caractersticas de
cada gas particular, que pueden ajustarse empricamente. No obstante, como modelo de gases reales
es bastante pobre. Su mayor interes reside en la prediccion que se deriva acerca de la transicion
P =

Termodinamica y Mecanica Estadstica I - Notas 2016

31

lquido gas. Analizaremos este problema en detalle mas adelante en el curso, de manera pospondremos por ahora esa discusion. No obstante, resulta de interes a este nivel analizar la relacion
fundamental de este modelo.
Para obtener la relacion fundamental necesitamos de otra ecuacion de estado. En su formulaci
on
original van der Waals no propuso ninguna forma para la ecuacion restante, limitandose a analizar
los efectos derivados de la ecuacion (150), la cual contiene por si misma muchsima informacion.
Siendo asi, tenemos libertad para efectuar una eleccion razonable de esta ecuacion en base a argumentos fsicos. Podemos encontrar una gua en los principios termodinamicos, ya que las ecuaciones
de estado no pueden ser arbitrarias. Para esto escribamos la Ec.(150) de la forma
P
R
a 1
=
2 ;
T
vb v T

(151)

para poder integrar la ecuacion molar


1
P
du + dv
T
T

ds =
necesitamos una ecuacion de la forma

1
= f (u, v).
T
No obstante, para obtener la relacion fundamental ds tiene que ser una diferencial exacta, lo que
implica que
2s
2s
=
,
vu
uv
es decir,

1
T

=
u

P
T

.
v

Ahora bien

1
T

R
a 1

u v b v 2 T

a
1
= 2
v u T v

(152)
v

(153)

Esta u
ltima ecuacion puede reescribirse como

v 2

f
v

=
u

f
(1/v)

=
u

f
(u/a)

(154)

1/v

Esta ecuacion nos dice que 1/T depende de las variables 1/v y u/a de tal manera que sus derivadas
parciales son iguales. Una manera de que esto suceda es que 1/T dependa de estas variables a traves
de la suma (1/v + u/a). Por otra parte, para bajas densidades 1/v 1 la ecuacion de estado debe
aproximarse a la del gas ideal 1/T = cR/u. La eleccion mas simple que satisface ambas condiciones
es
1
cR
=
.
T
u + a/v

(155)

Finalmente podemos reescribir la Ec.(150) en la forma correcta para la representaci


on entropa
como

Termodinamica y Mecanica Estadstica I - Notas 2016

32

P
R
acR
=

.
(156)
T
v b u v2 + a v
Vamos a referirnos al sistema hipotetico descripto por las ecuaciones de estado (155) y (156)
como al fluido ideal de van der Waals. De las ecuaciones (155) y (156) puede obtenerse la relacion
fundamental (la derivacion queda como ejercicio):
s = D + R ln [(v b)(u + a/v)c ]

(157)

donde D es una constante. Al igual que para el gas ideal esta ecuacion viola el cuarto postulado
(ley de Nernst), por lo cual no es valida a muy bajas temperaturas. Sin embargo, constituye una
aproximacion razonable del comportamiento de los gases reales a temperaturas menores que el gas
ideal.

4.4.

Radiaci
on de cuerpo negro

Si una cavidad cerrada vacia (sin materia) es mantenida a temperatura constante, se sabe
que la cavidad actua como un repositorio de energa electromagnetica; las pared irradian, y esta
radiacion electromagnetica toma una distribucion espectral estacionaria, de manera que el sistema
cavidad+campo electromagnetico se encuentra en equilibrio. Un sistema de este tipo se conoce
como cuerpo negro. Desde el punto de vista de la mecanica cuantica puede interpretarse que la
cavidad se encuentra llena de fotones que se crean y destruyen permanentemente. Desde el punto
de vista de la electrodinamica podemos pensar la cavidad como una cavidad resonante que soporta
cierta distribucion de modos electromagneticos. Desde el punto de vista de la termodinamica este es
un sistema en equilibrio, sin importar el mecanismo microscopico detallado. El estado de equilibrio
del cuerpo negro se encuentra descripto por las ecuaciones de estado:
= b V T4
(158)
U
P =
.
(159)
3V
donde la primera ecuacion se conoce como ley de Stephan-Boltzmann. Estas ecuaciones fueron
primero derivadas empricamente y posteriormente explicadas desde la mecanica estadstica cuantica. Notemos que estas ecuaciones de estado dependen de U y V pero no de N . Esto surge del hecho
de que en la cavidad vacia no existen partculas cuyo n
umero se conserve (a
un desde la interpretacion cuantica de los fotones como partculas, un estado cuantico con un n
umero bien definido
de fotones tiene valor medio cero). De esta manera, las u
nicas variables termodinamicas extensivas
relevantes son U y V y la relacion fundamental para la cavidad es de la forma S = S(U, V ); esto
significa que tenemos un u
nico grado de libertad y conviene reescalar las magnitudes extensivas
con V . Asi, en la representacion entropa las ecuaciones de estado toman la forma
U

b 1/4
1
=
(160)
T
u
P
1 1/4 3/4
=
b u
(161)
T
3
donde u U/V es la energa por unidad de volumen. Reemplazando en la relacion de Euler se
encuentra la relacion fundamental
4
s = b1/4 u3/4
(162)
3
donde s S/V es la entropa por unidad de volumen. Notemos que T = 0 S = 0, de manera
que esta relacion satisface el cuarto postulado.

Termodinamica y Mecanica Estadstica I - Notas 2016

4.5.

33

Sistemas magn
eticos

Unos de los sistemas mas interesantes desde el punto de vista termodinamico son los materiales
magneticos. Materiales compuestos por moleculas con propiedades magneticas intrnsecas pueden
presentar propiedades magneticas macroscopicas, una de cuyas manifestaciones posibles es la existencia de un momento magnetico macroscopico o magnetizaci
on. Esta magnetizacion puede estar
presente en ausencia de campo magnetico externo (magnetizacion permanente) o desarrollarse solo
en presencia de campo (magnetizacion inducida). Si la magnetizacion inducida ocurre en la direccion del campo externo el material se dice paramagn
etico; si la magnetizacion inducida es
contraria al campo externo el material se dice diamagn
etico. Si la magnetizacion es permanente
el material se dice ferromagn
etico.
La descripcion termodinamica de sistemas magneticos requiere de la introduccion de nuevos
parametros extensivos para tomar en cuenta estos grados de libertad, en adicion a los ya conocidos
parametros termicos y mecanicos. Por simplicidad, supongamos por ahora que solo necesitamos de
un parametro extensivo Xm , cuyo parametro intensivo asociado Pm tiene que ser tal que el trabajo
magnetico sea
d0 Wmag = Pm dXm
de tal manera que
dU = d0 Q + d0 WM + d0 Wq + d0 Wmag .
Vamos a considerar una situacion especfica que nos indica cual es la eleccion apropiada de
Xm . Supongamos que el sistema se encuentra en el centro de una solenoide, cuyas dimensiones son
mucho mayores que las de la muestra (sistema). El conjunto se encuentra aislado del exterior por
paredes adiabaticas, excepto por los alambres del solenoide, los cuales se encuentran conectados a
una batera externa, cuya fem puede ser controlada. Los alambres tienen resistencia electrica cero
(superconductores), de manera que no disipan calor. Si ahora hacemos circular por el solenoide
una corriente I se establecera en el interior del mismo un campo magnetico. Si la corriente I es
constante y no ocurren cambios en el sistema (esto es, en equilibrio), una vez establecido el campo
la batera no necesita suministrar una fem, ya que la resistencia de los cables es cero. El campo en
~ es proporcional a la corriente I:
el interior B
~ = ~bI
B

(163)

~ (~r) la magnetizacion local de nuestro sisdonde ~b es un vector que es funcion de la posicion. Sea M
tema termodinamico. La corriente I puede ser variada a traves de la batera, lo cual producira cambios en la magnetizacion en respuesta a los cambios en el campo magnetico. De este manera, la
magnetizacion es funcion de I. Vamos a asumir que la magnetizacion es una funci
on univaluada
de I:
~ (~r) = M
~ (~r, I).
M
~ (~r) no es univaluada en sistemas ferromagneticos que presentan hysteresis. No obstante, la
M
hysteresis estrictamente es un fenomeno de no-equilibrio, ya que las propiedades del sistema dependen de la historia de la muestra, con lo cual en principio el analisis de este fenomeno cae fuera
de la descripcion termodinamica. Esto, no obstante, no excluye del tratamiento termodinamico a
los materiales ferromagneticos, ya que bajo condiciones controladas es posible preparar muestras
de estos materiales sin hysteresis. Por otra parte, materiales paramagneticos y diamagneticos no
presentan histeresis.
Supongamos ahora que la corriente I se incrementa, increment
andose en consecuencia el campo
~
B y por lo tanto la magnetizacion. Para poder realizar estos cambios la batera tiene que realizar un

Termodinamica y Mecanica Estadstica I - Notas 2016

34

trabajo, ya que tiene que contrarestar la fem inducida en el solenoide por los cambios producidos en
~ yM
~ es precisamente
la induccion magnetica. La relacion entre dicho trabajo y las variaciones de B
lo que estamos buscando, ya que ese trabajo va a modificar la energa interna del sistema. La
potencia entregada por la batera en este proceso viene dada por
d0 Wmag
= I f em.
(164)
dt
La fem inducida en el solenoide procede de dos fuentes. Una fuente es independiente del sistema
~ a traves del solenoide.
termodinamico y resulta de los cambios producidos en el flujo del campo B
En lugar de calcular el cambio en el flujo, podemos escribir directamente la contribuci
on al trabajo
e
d0 Wmag
como el cambio en la energa del campo magnetico

e
d0 Wmag
=d

1
20

B 2 dV

(165)

donde 0 es la permeabilidad del vaco (esta es la energa del campo en ausencia del sistema) y
donde la integral se toma sobre el volumen completo del solenoide. No obstante, esta contribuci
on
es independiente del sistema y por lo tanto no la vamos a considerar con respecto a la energa
interna.
La segunda contribucion al trabajo realizado por la batera resulta enteramente de la presencia
del sistema en el solenoide y por lo tanto es la que nos interesa. Cada porcion infinitesimal del
~ (~r); cada uno
sistema puede ser pensado como un dipolo elemental con momento magnetico m
~ =M
de estos dipolos contribuye por separado y aditivamente a la f em total inducida. Mas a
un, la fem
inducida por un dipolo elemental no depende de la naturaleza del dipolo, sino de la posicion del
dipolo y del cambio producido en su momento dipolar. Podemos utilizar por lo tanto un modelo
particular para estos dipolos elementales que nos permita calcular el cambio en la f em inducida.
Representamos entonces el dipolo elemental en la posicion ~r como una espira elemental de area ~a
por la cual circula una corriente i. El momento magnetico es m
~ = i~a. El flujo del campo magnetico
~
~
~
B(~r) a traves de la espira elemental es B(~r).~a = I b(~r).~a = L I, donde L = ~b(~r).~a es la inductancia
mutua entre el solenoide y la espira. Un cambio en la corriente i en la espira va a inducir por lo
tanto una f em en el solenoide dada por
i di
di h~
dm
~
1~
dm
~
= b(~r).~a . = ~b(~r).
= B(~
r).
.
dt
dt
dt
I
dt
El trabajo hecho por la batera para cambiar el momento dipolar elemental es entonces

(166)

d0 Wmag
~
~ r). dm
= B(~
.
(167)
dt
dt
A pesar de que este resultado fue derivado para un modelo particular de un dipolo elemental,
puede verse que vale en general para cualquier cambio del momento dipolar local. En particular si
~ (~r), donde M
~ (~r) es el momento dipolar por unidad de volumen en el punto ~r, el
tomamos m
~ =M
trabajo total viene dado por
Z
~
d0 Wmag
~ r). dM dV
= B(~
dt
dt
donde la integral es sobre todo el volumen de la muestra. Asi, tenemos que
Z

d0 Wmag =

~ r).dM
~ dV.
B(~

(168)

(169)

Si el solenoide es mucho mas grande que la muestra y si la misma esta ubicada en el centro del
~ es constante en la misma. Mas a
solenoide el campo B
un, si suponemos la muestra de forma
elipsoidal, con uno de los ejes principales en la direccion del campo, y el sistema es homogeneo,

Termodinamica y Mecanica Estadstica I - Notas 2016

35

~ es independiente de la posicion. Si llamamos entonces I~


puede verse del electromagnetismo que M
al momento dipolar magnetico total del sistema, tenemos que
I~ =

~ dV = M
~V
M

(170)

y
dU = T dS P dV + BdIB +

j dNj

(171)

~ Vemos entonces que el par


donde IB es la componente de I~ paralela a B.
ametro extensivo que
describe las propiedades magneticas de un sistema es la componente del momento magnetico total
paralela al campo externo. El par
ametro intensivo correspondiente en la representaci
on energa es
el campo B.
La relacion fundamental es entonces
U = U (S, V, IB , N1 , . . . , Nr )
y

U
IB

= B.
S,V,N1 ,...

La ecuacion de Euler para un sistema magnetico monocomponente es


U = T S P V + BIB + N

(172)

SdT V dP + Ib dB + N d = 0

(173)

y la relacion de Gibbs-Duhem es

A pesar de que la magnetizacion aparentemente cumple el mismo rol en las relaciones termodinamicas que los demas parametros extensivos, la misma presenta ciertas peculiaridades que
la diferencian. Estas peculiaridades se hacen manifiestas si intentamos plantear el problema del
equilibrio entre dos subsistemas cuando removemos un vnculo interno. Rapidamente nos damos
cuenta de que no es posible restringir la magnetizaci
on mediante una pared.
A los fines de comparacion, pensemos en el vol
umen en un gas y su parametro intensivo conjugado, la presion. Tenemos varias maneras de controlar el vol
umen. Podemos, por ejemplo, controlar
el vol
umen controlando externamente la presion de un piston. Asi, podemos ingeniar un mecanismo
de control de presion que permanentemente monitorea el vol
umen del sitema y automaticamente
modifica la presion externa de manera de mantenerlo constante. Algo semejante podramos hacer
regulando la temperatura. Sin embargo, la existencia de paredes rgidas hace que podamos fijar
el vol
umen del sistema directamente, independientemente de los valores de temperatura y presion.
En el caso de sistemas magneticos podemos fijar la magnetizacion solo a traves del campo externo,
el cual es controlable. No podemos fijar directamente la magnetizacion, independientemente del
campo externo, ya que no existen paredes restrictivas para la magnetizaci
on. Esto, sin embargo, no
invalida la aplicacion del formalismo termodinamico. Podemos pensar en la existencia de paredes
virtuales restrictivas para la magnetizacion y desarrollar la teora en la misma forma que lo hicimos
para el resto de las variables. La validez de esta metodologa se comprueba en ultima instancia con
la confrontacion de las predicciones con los experimentos.
No obstante, en la practica esto requiere de ciertas consideraciones a la hora de aplicar la teora.
Por ejemplo, resulta mas conveniente utilizar algun tipo de representaci
on en la cual la magnetizacion aparece como una variable dependiente y el campo magnetico como variable independiente.

Termodinamica y Mecanica Estadstica I - Notas 2016

36

Si el sistema es un solido magnetico, el volumen en general vara muy poco con la temperatura
o la presion. En este caso el vol
umen deja de ser una variable termodinamica relevante. Para un
solido paramagnetico a temperaturas no muy bajas la ecuacion de estado magnetica resulta bien
aproximada por la ley de Curie:
ND
B
(174)
T
donde D es una constante que depende del material. Sistemas ferromagneticos presenta ecuaciones
de estado mucho mas complejas, que veremos mas adelante.
Finalmente, para los sistemas magneticos tenemos dos funciones respuesta de interes particular:
el calor especfico a campo constante
IB =

CB = T

s
T

=
B

T
N

S
T

(175)
B

y la susceptibilidad isotermica
1
T =
N

IB
B

(176)
T

la cual nos mide la variacion en la magnetizacion por unidad de cambio del campo externo a
temperatura constante.

4.6.

La banda de goma

Una banda de goma esta compuesta por un manojo de polmeros, los cuales constituyen
moleculas lineales muy largas o cadenas de unidades moleculares mas simples denominadas monomeros.
Estas moleculas pueden enrrollarse en si mismas o desplegarse, dependiendo de la temperatura y la
tension aplicada, lo cual da a estos sistemas sus propiedades elasticas. Podemos contruir un modelo
fenomenologico simple de la termodinamica de estos sistemas, basandonos en unas pocas observaciones empricas. En primer lugar, identifiquemos las variables macroscopicas relevantes. Para ello
trabajemos incialmente en la representaci
on energa. Ademas de la entropa, debemos considerar las
variables asociadas con el trabajo mecanico. Dado que, al menos bajo ciertos lmites estos sistemas
se comportan como un resorte, el trabajo viene dado por d0 W = T dL, donde T es la tension y L
es la longitud. Vemos as que la variable extensiva mecanica relevante es L (la cual juega un rol
analogo al vol
umen en un gas) y su variable intensiva conjugada T = U/L, (la cual juega un rol
analogo al de una presion negativa). As, la relacion fundamental tiene la forma U = U (S, L, N )
o S = S(U, L; N ).
Experimentalmente se observa que, a temperatura constante, la energa es practicamente independiente de la longitud (al menos dentro del lmite elastico L0 < L < L1 , donde L0 es la longitud
en ausencia de tension). La ecuacion de estado mas simple compatible con este requerimiento es
U = c L0 T

(177)

Otra observacion emprica es que, a longitud constante, la tension se incrementa con la temperatura. Combinando esto con la propiedad elastica del sistema, podemos formular la segunda
ecuacion de estado
T = (T )

L L0
para L0 < L < L1
L1 L0

donde (T ) es creciente con T . En la representaci


on entropa tenemos entonces

(178)

Termodinamica y Mecanica Estadstica I - Notas 2016

1
T
T
T

=
=

c L0
U
(T ) L L0
T L1 L0

37

(179)
(180)

De la igualdad de las derivadas segundas de la relacion fundamental, se obtiene entonces que


(T ) = b T con b > 0. Finalmente, para considerar la dependencia con el n
umero molar (cantidad
de polmeros) podemos asumir que L = l N , L0 = l0 N y L1 = l1 N . De esta manera, tenemos la
ecuacion diferencial molar
ds =

T
du
l l0
1
du dl = cl0
b
dl
T
T
u
l1 l0

la cual integrada y mutiplicada por N nos da la relacion fundamental:


S = N s0 + cL0 ln

U
b

(L L0 )2
U0 2(L1 L0 )

(181)

A pesar de que esta relacion fundamental fue derivada a partir de informacion emprica sumamente basica, la misma representa razonablemente bien el comportamiento de sistemas reales.

Termodinamica y Mecanica Estadstica I - Notas 2016

5.

38

Procesos reversibles y el Teorema de M


aximo Trabajo

El segundo postulado de la termodinamica tiene profundas implicancias, no solo para la caracterizacion de los estados de equilibrio, como tambien impone severas limitaciones a los procesos
o transformaciones termodinamicas, entendiendo como tales aquellos que me llevan de un estado
de equilibrio a otro (no necesariamente pasando por estados de equilibrio). Toda transformacion
termodinamica puede pensarse como el resultado de la manipulacion de un conjunto de vnculos
internos en un sistema cerrado. En u
ltima instancia, el sistema cerrado puede ser el Universo. El
segundo postulado nos dice entonces que en todo proceso llevado a cabo en un sistema cerrado la
entropa nunca puede disminuir. Es mas, en la mayora de los procesos la entropa aumenta.
Por otra parte, otra consecuencia derivada del segundo postulado se refiere a la cantidad de
trabajo mecanico que podemos extraer de una maquina termica. En terminos generales una maquina
termica es aquella que transforma calor en trabajo mecanico. El funcionamiento general de una
maquina termica se basa mas o menos en los mismos principios. Se dispone de dos fuentes de
temperatura, una a mayor temperatura que la otra. Primero se transfiere calor de la fuente a alta
temperatura a alguna sustancia (ej., vapor de agua) la cual se expande moviendo algun dispositivo
mecanico, tal como un piston, el cual tranfiere el trabajo mecanico al exterior. Para poder reiniciar
el ciclo el piston debe volver a su posicion original, con lo cual la sustancia debe ser expulsada
del cilindro. Al hacerlo esta entrega calor a la fuente de menor temperatura, la cual puede ser
simplemente la atmosfera. Podemos inclusive pensar que todo el calor disipado por rozamiento se
entrega a la misma fuente fria. La pregunta entonces es, cual es el m
aximo trabajo que podemos
extraer de esta m
aquina?. Por la conservaci
on de la energa es claro que el trabajo obtenido no
puede superar la cantidad de calor extraida de la fuente caliente. Por el segundo postulado vamos
a ver que es siempre mucho menos.
Tomemos un ejemplo simple. Supongamos un sistema simple encerrado en un recipiente impermeable de volumen constante. Para este sistema tenemos un u
nico grado de libertad y por lo
tanto la entropa sera solo funcion de U . Supongamos que el calor especfico a volumen constante
es constante. La capacidad calorfica del sistema, se define como C Cv N . Es facil ver que para
este sistema
dU
.
dT
La energa interna y la entropa pueden entonces escribirse como
C=

= CT

S = N s0 + C ln

(182)

(183)
U
T
= N s0 + C ln
U0
T0

(184)

Podemos verificar que estas ecuaciones se verifican tanto para el gas ideal como para el fluido de
van der Waals a volumen y n
umero de moles constantes.
Supongamos que tenemos dos de estos sistemas identicos, a diferentes temperaturas iniciales
T10 y T20 , con T10 < T20 . Supongamos ahora que se dise
na una maquina termica que extrae energa
mecanica del sistema termodinamico compuesto por estos dos subsistemas, con el objetivo u
nico
de levantar por una vez en la vida un ascensor hasta una altura determinada (esto es, un sistema
p
uramente mecanico que absorve trabajo). La pregunta es: dadas las temperaturas iniciales, llega
el ascensor hasta la altura deseada? Veamos.
La maquina solo puede trabajar mientras exista diferencia de temperaturas entre las fuentes,
es decir, funcionara hasta que las temperaturas se equilibren en un valor final Tf que sera T10 <
Tf < T20 . El cambio de energa en los dos susbsistemas termicos al arribar al estado de equilibrio
final sera:

Termodinamica y Mecanica Estadstica I - Notas 2016

39

U = 2CTf C(T10 + T20 )

(185)

y el trabajo entregado al sistema mecanico (el ascensor) sera


W = U = C(T10 + T20 2Tf ).

(186)

El cambio en la entropa total ocurre exclusivamente en los dos sistemas termodinamicos y viene
dado por
S = C ln

Tf
Tf
Tf
+ C ln
= 2C ln
T10
T20
T10 T20

(187)

Ahora bien, la eficiencia con que la maquina transforma calor en trabajo depende del funcionamiento detallado de la misma. De la Ec.(186) vemos que diferentes cantidades de trabajo
extraido van a determinar diferentes temperaturas Tf . El trabajo sera maximo cuando Tf sea mnima, lo cual por la Ec.(187) corresponde a S mnima. Por el segundo postulado, el mnimo de S
es cero, en cuyo caso
p

Tf

T10 T20

= C(T10 + T20 2 T10 T20 ).

(188)
(189)

Asi, el maximo trabajo se obtiene por medio de un proceso isoentr


opico.

5.1.

Procesos cuasi-est
aticos y procesos reversibles

El resultado anterior es un caso particular de un teorema general derivado del segundo postulado.
Antes de enunciar el teorema vamos a revisar con un poco mas de detalle diversos conceptos
asociados con la descripcion de los estados y procesos.
Una construccion util para la descripcion de los procesos termodinamicos es lo que vamos a
definir como el espacio de configuraciones termodin
amicas. Este es un espacio abstracto
multidimensional cuyos ejes coordenados corresponden a la entropa S y a las variables de estado
extensivas independientes que describen el estado termodinamico del sistema. Asi, para un sistema
simple de r componentes qumicas tenemos un espacio de r + 3 dimensiones correspondientes a
las variables S, U , V , N1 , . . . , Nr . La relacion fundamental del sistema S = S(U, V, N1 , . . . , Nr )
define una hipersuperficie en este espacio, la cual presenta una serie de propiedades comunes para
cualquier sistema, ya que (S/U ) > 0 y S tiene que satisfacer la relacion de Euler, como resultado
derivado de su aditividad. En la figura 4 se muestra un ejemplo del espacio de configuraciones para
una cavidad electromagnetica. Por definicion, todos los puntos sobre la hipersuperficie entropa
corresponden a estados de equilibrio. A su vez, todos los estados de equilibrio posibles para un
sistema son representables en este espacio.
Para un sistema compuesto el espacio de configuraciones comprendera todos los parametros extensivos de todos los subsistemas y relacion fundamental estara representada por una hipersuperficie
(1)
(i)
S = S(X0 , . . . , Xj , . . .). Para un sistema compuesto por dos subsistemas una representaci
on alternativa consiste en representar en los ejes la entropa S, los parametros del sistema total U, V, N1 , . . .
y los parametros de uno de los subsistemas, digamos, U (1) , V (1) , . . .. Esta representaci
on tiene la
ventaja de que podemos encontrar los valores de equilibrio tomando cortes de esta superficie con
planos U = cte, V = cte, etc, los cuales en este caso estan representados por planos paralelos a los
planos coordenados.
Consideremos una curva arbitraria sobre la hipersuperficie entropa, comenzando desde un estado inicial A, terminando en un estado final H. Una curva de este tipo define una trayectoria
cuasi-est
atica o proceso cuasi-est
atico. Un proceso cuasi-estatico es definido entonces como

Termodinamica y Mecanica Estadstica I - Notas 2016

40

1.2

1.0

.8

.6
.4
1.2
1.0

.2

.8
.6
1.0

.8

.4
.6

.2

.4
.2

0.0

0.0

0.0

Figura 4: Espacio de configuraciones para una cavidad electromagnetica. U , S y V en unidades


arbitrarias.
una sucesi
on densa de estados de equilibrio. Conviene recalcar que un proceso cuasi-estatico
es un concepto idealizado, que en principio difiere bastante de un proceso fsico real. Un proceso
cuasi-estatico no involucra ning
un tipo de consideracion acerca de velocidades o tiempos; es simplemente una sucesion ordenada de estados de equilibrio. Un proceso fsico real es una sucesi
on
temporal de estados de equilibrio, alternados con estados de no-equilibrio. Estos u
ltimos estados no
estan representados en el espacio de configuraciones. No obstante podemos llevar a cabo procesos
reales controlados que aproximen sumamente bien procesos cuasi-estaticos. En particular, es posible
llevar un sistema de un estado de equilibrio inicial A hasta un final H a traves de una sucesion
de estados que coincida en un n
umero arbitrario de puntos con una trayectoria cuasi-estatica. Asi,
si la trayectoria contiene un cierto n
umero de estados de equilibrio intermedios B, C, . . . podemos
inicialmente remover un cierto vnculo que permita al sistema evolucionar del estado de equilibrio
A al B, pasando por estados de no equilibrio. Una vez que el sistema equilibro en B, relajamos
nuevamente el vnculo hasta que equilibra en C y asi sucesivamente hasta llegar a H. El conjunto
de puntos A, B . . . , H constituye una aproximaci
on de la trayectoria cuasi-estatica que va de A a
H. Controlando de manera mas fina los vculos podemos hacer que nuestro proceso real coincida
en tantos puntos como querramos con la trayectoria cuasi-estatica.
Recalquemos que la identificacion de P dV como el trabajo mecanico y de T dS es valida
u
nicamente para procesos cuasi-estaticos.
Consideremos ahora un sistema cerrado que es llevado por la sucesion de estados A, B . . . , H que
aproximan una trayectoria cuasi-estatica, mediante la remocion sucesiva de una serie de vnculos
internos. Al remover el primer vnculo el sistema va a evolucionar de A a B, siempre que B sea el
estado de maxima entropa entre todos los nuevos estados compatibles con los vnculos restantes.
En particular, el estado B no puede tener entropa menor que A. De esta manera, el proceso fsico
que lleva de A a B tiene una direccionalidad definida. Si B tiene mayor entropa que A, no existe
ning
un proceso fsico para el sistema cerrado que me lleve de B a A. Estos procesos son por lo
tanto irreversibles.
Una trayectoria cuasi-est
atica puede ser aproximada por un proceso real en un
sistema cerrado solo si la entropa es mon
otonamente no-decreciente a lo largo de la

Termodinamica y Mecanica Estadstica I - Notas 2016

41

trayectoria. El caso lmite de un proceso cuasi-estatico en el cual el incremento de entropa


tiende a cero es llamado un proceso reversible. Procesos isoentr
opicos son entonces reversibles y
pueden ser recorridos en cualquier direccion.
Existe bastante confusion en la literatura tradicional acerca del concepto de proceso reversible.
En muchos textos se denomina reversible a un proceso cuasi-estatico. Esta es una concepcion errada,
ya que procesos cuasiestaticos que aumentan la entropa total, no pueden ser revertidos por ning
un
proceso real sin que exista un aumento de entropa mayor en alguna parte del universo. Todos los
procesos reversibles son cuasi-estaticos pero la recproca no es cierta.

5.2.

Tiempos de relajaci
on e irreversibilidad

En relacion a los procesos reales que aproximan procesos cuasi-estaticos conviene poner un poco
los pies en la tierra y analizar con mas cuidado en que situacion es factible realizar un proceso de
este tipo. Para esto necesariamente tenemos que tomar en cuenta algunos aspectos dinamicos de
los procesos
En teora la manera de realizar un proceso aproximadamente cuasi-estatico sera proceder de
a pasos, relajando levemente alg
un vnculo y esperando a que el sistema relaje completamente al
equilibrio antes de proceder a relajar el vnculo siguiente. En la practica rara vez se lleva a cabo este
procedimiento. En su lugar se varan los vnculos de manera continua, a un ritmo suficientemente
lento.
El ritmo al cual los vnculos pueden ser relajados esta caracterizado por los que se conoce
como tiempo de relajaci
on . Supongamos que tenemos alguna propiedad del sistema X (ej, la
temperatura) la cual toma un cierto valor Xe si el sistema esta en un dado estado de equilibrio.
Supongamos ahora que apartamos el sistema de su estado de equilibrio y luego lo dejamos relajar.
Se observa que en general la mayora de los sistemas relaja exponencialmente al equilibrio, esto es
X(t) X(0)et/ , donde X(t) X(t) Xe . Esto define el tiempo de relajacion caracterstico
, el cual depende del sistema particular.
Supongamos un sistema particular con tiempo de relajacion . Procesos que ocurran en tiempos
peque
nos comparados con no seran cuasiestaticos, mientras que procesos que ocurran en tiempos
muy grandes comparados con seran aproximadamente cuasiestaticos.
El tiempo de relajacion caracterstico de un sistema particular depende en general de varios
factores. Podemos dar una idea general acerca del tipo de factores a traves de un ejemplo. Consideremos un gas encerrado en un cilindro con un piston movil, ambos rgidos, impermeables y
adiabaticos. Disminuyendo muy lentamente la presion externa ejercida sobre el piston podemos
llevar a cabo una expansion adiabatica aproximadamente cuasiestatica. Siendo el proceso cuasiestatico y adiabatico tenemos que dS = d0 Q/T = 0 y por lo tanto el proceso es reversible. Si por el
contrario el piston es tirado rapidamente, el movimiento resultante del cilindro transmitira energa
cinetica al gas, generando turbulencia. Esto va a aumentar la entropa del sistema y el proceso no
es ni cuasi-estatico ni reversible. Podemos estimar el tiempo de relajacion si consideramos que el
movimiento del piston disminuye la densidad del gas en sus cercanas. Esta disminuci
on local en la
densidad se va a propagar al resto del gas, homogeneizando la densidad total. Tendremos entonces
una onda de densidad que se propaga a la velocidad del sonido en el gas. Esta onda se va a disipar
a traves de reflecciones incoherentes en las paredes del cilindro (podemos suponer que las paredes
tienen cierta rugosidad) y por el amortiguamiento viscoso dentro del gas. En el mejor de los casos
podemos suponer que la onda se disipa en una u
nica refleccion. En este caso el tiempo de relajacion
va a ser proporcional al tiempo requerido por la onda para propagarse a todo el sistema. Dado
que la longitud caracterstica del sistema es proporcional a V 1/3 tenemos que V 1/3 /c, donde c
es la velocidad del sonido en el medio. Si la expansion se realiza en un tiempo mucho mayor que
la misma ocurre reversible e isoentropicamente. Asi, podramos comprimir nuevamente el gas
cuasi-estaticamente y llevar el sistema de manera adiabatica mas o menos al mismo estado original.
Si la expansion ocurre en tiempos cortos o comparables con (por ejemplo, en una expansion libre)

Termodinamica y Mecanica Estadstica I - Notas 2016

42

habra un incremento irreversible de entropa y el proceso, a pesar de adiabatico sera irreversible.


En este caso no podremos llevar el sistema nuevamente a su estado original mediante una compresion adiabatica, siendo necesario extraer calor del mismo. Veamos esto mejor. Supongamos que el
sistema es un gas ideal y que el cilindro es cerrado, con el piston fijo inicialmente por un tornillo a
mitad del vol
umen del cilindro. Supongamos ademas que la otra mitad de la camara esta totalmente
vaca. Si ahora retiramos bruscamente el tornillo tendremos una expansion libre, al final de la cual
el gas ocupara todo el vol
umen. Dado que la energa no depende del vol
umen y dado que el piston
no realiza trabajo, la temperatura inicial sera igual a la inicial. Para un gas ideal con N constante
tenemos que
S = N s0 + cN R ln

V
T
+ N R ln .
T0
V0

Asi, el cambio de entropa sera


S = N R ln

Vf
= N R ln 2 > 0.
Vi

Es importante darse cuenta que, para realizar una expansion cuasi-estatica isoentr
opica el piston
debe realizar trabajo, con lo cual la energa interna disminuye, es decir, el gas se enfria. En la
expansion libre el gas no se enfria. En este u
ltimo caso, si queremos revertir el proceso, es decir
llevar nuevamente al sistema a su estado inicial, esto es imposible mediante un proceso adiabatico
ya que tenemos que realizar trabajo sobre el gas, lo cual aumentara su temperatura.

5.3.

Flujo de calor entre dos sistemas acoplados

Tal vez el proceso termodinamico mas caracterstico es el intercambio cuasi-estatico de calor


entre dos sistemas a diferentes temperaturas. Asi, resulta instructivo revisar este proceso en mas
detalle, a la luz de las discusiones precedentes.
Supongamos dos sistemas simples con vol
umenes y n
umeros de moles constantes a temperaturas
iniciales T10 y T20 , con T10 < T20 . Sean C1 (T ) y C2 (T ) las capacidades calorficas de ambos sistemas.
Si una cantidad d0 Q1 es transferida cuasi-estaticamente al sistema 1 el incremento de entropa viene
dado por
dS1 =

d0 Q1
dT1
= C1 (T1 )
T1
T1

(190)

y en forma similar para el sistema 2. Esta transferencia de calor del sistema 2 al 1 continua hasta
que las temperaturas se equilibran en un mismo valor Tf . En este caso la conservaci
on de la energa
nos impone que
U =

Z Tf
T10

C1 (T1 )dT1 +

Z Tf
T20

C2 (T2 )dT2 = 0.

(191)

Esta ecuacion determina Tf . El cambio total en la entropa viene dado por


S =

Z Tf
C1 (T1 )
T10

T1

dT1 +

Z Tf
C2 (T2 )
T20

T2

dT2

(192)

Si en particular C1 y C2 son independientes de T la conservaci


on de la energa nos da
Tf =
y el incremento de entropa resulta

C1 T10 + C2 T20
C1 + C2

(193)

Termodinamica y Mecanica Estadstica I - Notas 2016

S = C1 ln

Tf
Tf
+ C2 ln
.
T10
T20

43

(194)

Trabajando estas expresiones puede verse que S es intrnsicamente positiva. Vemos que este proceso, a
un cuasi-estatico, es siempre irreversible. Este proceso puede asociarse con el flujo espont
aneo
de calor entre dos sistemas a diferentes temperaturas si: (i) la pared que separa los subsistemas
tiene una capacidad calorfica despreciable, de manera que no participa del proceso termodinamico
y (ii) si el flujo de calor a traves de la pared es suficientemente lento (esto es, la pared tiene una
resistividad termica lo suficientemente alta) de manera de permitir que la temperatura en cada
subsistema sea espacialmente homogenea en todo el proceso.
Notemos que la entropa de uno de los subsistemas decrece mientras que la del otro crece. La
entropa puede disminuir localmente, siempre que se produzca un crecimiento mayor
en alg
un otro sistema. En este sentido, un proceso irreversible puede ser revertido a costa de un
incremento mayor de entropa en alguna otra parte.

5.4.

El Teorema de M
aximo Trabajo

En terminos generales, toda maquina termica puede esquematizarse como se muestra en la figura
5. Tenemos un sistema que es llevado de un estado de equilibrio A a un estado B con un cambio
en la energa interna U y un cambio en la entropa S (por ejemplo, un gas en combusti
on).
Tenemos ademas dos sistemas auxiliares que participan del proceso: uno al cual se transfiere trabajo
y otro al cual se transfiere calor.
Teorema: De todos los procesos que conectan los mismos estados inicial y final, el trabajo
entregado es m
aximo (y el calor entregado es mnimo) para los procesos reversibles. Mas
a
un, la cantidad de trabajo entregada es id
entica para todos los procesos reversibles.
El repositorio al cual el sistema entrega trabajo se conoce como una fuente de trabajo reversible, la cual se define como un sistema encerrado por paredes adiab
aticas e impermeables, caracterizado por tiempos de relajaci
on lo suficientemente cortos como para que todos los procesos de
interes que ocurran en el sean esencialmente cuasi-est
aticos. Desde el punto de vista termodinamico
todos los sistemas conservativos (esto es, sin friccion) de la mecanica clasica son fuentes de trabajo
reversibles.
El repositorio al cual el sistema entrega calor se conoce como una fuente de calor reversible
, la cual se define como un sistema encerrado por paredes rgidas e impermeables, caracterizado
por tiempos de relajaci
on lo suficientemente cortos como para que todos los procesos de interes que
ocurran en el sean esencialmente cuasi-est
aticos. Si la fuente de calor se encuentra a la temperatura T y se le transfiere una cantidad de calor d0 Q, esta incrementa su entropa en una cantidad
dS = d0 Q/T . Siendo que todos los procesos son cuasi-estaticos dicha entropa puede disminuirse
extrayendo la misma cantidad de calor d0 Q y de ahi el nombre de reversible. Esto u
ltimo no viola el
postulado de maxima entropa, ya que no estamos hablando de un proceso en un sistema cerrado.
Dado que la fuente tiene vol
umen y n
umero de moles constantes, todas sus interacciones con el
exterior estan completamente descriptas por su capacidad calorfica C(T ). El cambio en la energa
interna viene dado por dU = d0 Q = C(T )dT y el cambio en la entropa por dS = [C(T )/T ]dT .
La demostracion del teorema es casi inmediata y sigue la misma linea de razonamiento del
ejemplo presentado al comienzo de esta captulo. Supongamos que U < 0, con lo cual el sistema
entrega a la maquina cierta cantidad de calor y cierta cantidad de trabajo, lo cual implica que
S < 0. Por la conservacion de la energa tenemos que
U + Qf c + Wf t = 0.

Termodinamica y Mecanica Estadstica I - Notas 2016

44

Fuente de
Calor
Reversible

Qfc
Fuente de
Trabajo
Reversible
Wft

-U
SISTEMA
A

U S

Figura 5: Diagrama esquematico de una maquina termica


La cantidad U esta especificada, por lo cual la u
nica manera de maximizar Wf t es minimizar Qf c .
Por el segundo postulado tenemos que
Stotal = S + Sf c 0
ya que los u
nicos cambios de entropa ocurren en estos dos subsistemas. Asi, si S < 0 la fuente
de calor reversible debera aumentar su entropa al menos en una cantidad igual a la disminuci
on
ocurrida en el sistema, la cual esta especificada. La cantidad de calor transferida a la fuente sera
mnima cuando Sf c sea mnima y esto ocurre cuando Stotal = 0, es decir, cuando el proceso es
reversible.
Para un proceso reversible tenemos entonces que
Wf t = U

Z T1
T0

Cf c (Tf c )dTf c .

(195)

y
Sf c =

Z T1
Cf c (Tf c )
T0

Tf c

dTf c = S.

(196)

donde T0 y T1 son las temperaturas inicial y final respectivamente de la fuente de calor. De la


Ec.(196) podemos determinar la temperatura final de la fuente T1 y de la Ec.(195) podemos calcular
el trabajo maximo. Notemos que en estas ecuaciones no hay ninguna referencia al proceso particular
utilizado, salvo que es reversible. Asi, el trabajo maximo es identico para todo proceso reversible.
El problema se simplifica si la fuente de calor reversible es un reservorio t
ermico, el cual se
define como una fuente de calor reversible tan grande que la transferencia de calor en cualquier
proceso de interes no altera su temperatura. Para un reservorio de calor ideal la capacidad calorfica
es infinita. En terminos practicos un reservorio termico podra ser el oceano o la atmosfera. En este
caso tenemos que
Z

Sres =

Qres
d0 Qres
=
= S
Tres
Tres

Termodinamica y Mecanica Estadstica I - Notas 2016

45

y
Wf t = U Qres = Tres S U
y el trabajo maximo queda enteramente determinado por Tres y los estados inicial y final del
sistema.
Finalmente notemos que las direcciones de las flechas en el diagrama de la figura 5 pueden
invertirse todas. En este caso vamos a extraer calor y trabajo de las fuentes reversibles y entregarlos
al sistema en consideracion, el cual aumentar
a su energa interna y su entropa. En este caso
el teorema puede re-enunciarse diciendo que el trabajo necesario para llevar el sistema de A a
B es mnimo para los procesos reversibles. Este trabajo puede calcularse cambiando los signos
apropiadamente en las expresiones anteriores.
Veamos un ejemplo de aplicacion del teorema anterior. Supongamos que el sistema es un mol
de un fluido ideal de van der Waals, el cual es llevado de un estado inicial T0 , v0 a un estado final
Tf , vf , mediante alg
un procedimiento no especificado. Supongamos que la fuente reversible de calor
es un sistema mantenido a volumen constante, cuya capacidad calorfica es C2 (T ) = DT , donde
D = cte, y cuya temperatura inicial es T20 . La energa interna de la fuente de calor puede obtenerse
integrando C2 (T ):
Z

U2 (T ) =

1
C2 (T )dT = DT 2 + cte;
2

la entropa de la fuente viene dada por


Z

S2 (T ) =

C2 (T )
dT = DT + cte.
T

Recordemos que para un fluido de van der Waals tenemos que


u1 (T, v) = cRT

a
v

s1 (T, v) = s0 + R ln(v b) + cR ln T.
Asi, tenemos que
U1 = cR(Tf T0 )

vf b
S1 = R ln
v0 b

a
a
+
vf
v0

+ cR ln

Tf
.
T0

La fuente de calor cambiara su temperatura de T20 a una temperatura T2f a determinar, de tal
manera que

1 2
2
U2 = D T2f
T20
= Q2
2

S2 = D (T2f T20 ) .
La condicion de reversibilidad nos da que

vf b
S1 + S2 = R ln
v0 b

+ cR ln

Tf
+ D (T2f T20 ) = 0,
T0

Termodinamica y Mecanica Estadstica I - Notas 2016

46

de donde podemos despejar T2f :

T2f = T20

vf b
R
ln
D
v0 b

cR Tf
ln ;
D
T0

de la conservacion de la energa calculamos entonces el trabajo maximo que se puede entregar a la


fuente reversible de trabajo W3

1 2
a
a
2
T20
cR(Tf T0 ) +

W3 = U1 Q2 = D T2f
2
vf
v0

5.5.

Eficiencia de una m
aquina termodin
amica

Resulta interesante analizar el teorema de maximo trabajo en terminos diferenciales. Tenemos


que
dU + d0 Qf c + d0 Wf t = 0
y para un proceso reversible
dStotal = dS +

d0 Qf c
= 0,
Tf c

de donde
d0 Wf t = Tf c dS dU.
Ahora bien, supongamos que el sistema entrega cuasi-estaticamente a la maquina una cantidad de
calor d0 Q a la temperatura T > Tf c y que no entega trabajo de forma directa, de tal manera que
dU = d0 Q y dS = d0 Q/T . Reemplazando en la expresion anterior tenemos que

d0 Wf t =

Tf c
d0 Q dU = 1
T

Tf c
T

(d0 Q).

(197)

Asi, en un proceso infinitesimal, el trabajo maximo que puede entregarse a una fuente de trabajo
reversible es una fraccion (1 Tf c /T ) del calor (d0 Q) directamente extraido del sistema, en tanto
que una fraccion Tf c /T es entregada a la fuente de calor.
Dado que el sistema primario se encuentra siempre a mayor temperatura que la fuente fria (de
otro modo la maquina no funciona), llamemos Tf = Tf c (fuente fria) y Tc = T (fuente caliente).
La fraccion (1 Tf /Tc ) del calor extraido del sistema que puede ser convertida en trabajo en un
proceso infinitesimal se denomina la eficiencia termodin
amica de la m
aquina:

d0 Wf t
Tf
=1
(d0 Q)
Tc

(198)

Para un sistema a una temperatura Tc la eficiencia se incrementa al disminuir Tf , es decir, una


maquina es mas eficiente cuanto mayor sea la diferencia de temperaturas entre las fuentes. La
maxima eficiencia posible = 1 se obtiene si la fuente fria se encuentra a temperatura cero.
Si fuera posbile acceder a un reservorio a temperatura cero, cualquiera fuera la temperatura del
sistema podramos transformar todo el calor en trabajo. El cuarto postulado impide esto.
El teorema de maximo trabajo nos dice entonces que la eficiencia de una m
aquina reversible es una cota superior a la eficiencia de cualquier m
aquina que trabaje entre las
mismas temperaturas
Un refrigerador es una maquina termica que funciona en reversa. En este caso una cantidad
de trabajo (d0 Wf t ) es entregada a la maquina para extraer una cantidad de calor (d0 Qf ) de la

Termodinamica y Mecanica Estadstica I - Notas 2016

47

fuente fria, y la maquina entrega una cantidad de calor d0 Qc al sistema caliente. La fuente caliente
tpicamente es la atmosfera y la fuente fria la bebida que tenemos en el congelador. Esta maquina
puede trabajar reversiblemente, y las misma expresiones anteriores siguen siendo validas, poniendo
los signos adecuados. Asi, tendremos que (d0 Qf ) = (Tf /Tc )d0 Q y (d0 Wf t ) = (1 Tf /Tc )d0 Q.
En este caso resulta mas adecuado definir la eficiencia como la razon entre el calor extraido de la
fuente fria y el trabajo entregado para extraerla (el cual es mnimo para un proceso reversible). Se
define asi el coeficiente de eficiencia del refrigerador como:
(d0 Qf )
Tf
=
(199)
(d0 Wf t )
Tc Tf
Cuando Tf Tc el coeficiente del refrigerador tiende a infinito. En este caso se requiere una
cantidad nfima de trabajo para transferir calor de un sistema a otro. Por el contrario, si Tf 0
el coeficiente r tiende a cero. Asi, se requieren cantidades enormes de trabajo para extraer a
un
cantidades nfimas de calor de un sistema a temperaturas cercanas a cero.
r

5.6.

El ciclo de Carnot

En todo el desarrollo anterior hemos esquematizado una maquina termica como un dispositivo
que toma energa de una fuente caliente y la transfiere, parte en forma de calor a una fuente fria
y parte en forma de trabajo a una fuente reversible. En ning
un momento hemos especificado el
proceso fsico particular mediante el cual se lleva a cabo esta operacion, a fin de enfatizar que la
cantidad maxima de trabajo entregada es un atributo de todo proceso reversible. Vamos entonces a
analizar algunos procesos particulares mediante los cuales esto puede ser llevado a cabo. Para esto
necesitamos un sistema termodinamico auxiliar, el cual constituye la m
aquina fsica. Este sistema
puede ser de diferentes tipos, tal como un fluido en un cilindro con un piston o un sistema magnetico
en en campo externo controlable. La caracterstica importante que debe tener este sistema auxiliar
a fin de adaptarse al esquema anterior es que, al final del proceso, no debe contribuir al balance
total de energa y entropa. En otras palabras, al final del proceso el sistema auxiliar tiene que
terminar en el mismo estado que empezo, es decir, la transformacion termodinamica que sufre tiene
que ser cclica.
El proceso mas simple que puede llevarse a cabo entre dos fuentes de temperatura se conoce
como ciclo de Carnot. Vamos a asumir por simplicidad que tanto el sistema primario (la fuente
caliente) como la fuente de calor reversible son reservorios termicos con temperaturas Tc y Tf
respectivamente. Para fijar ideas vamos a considerar el caso particular de un gas encerrado en un
cilindro con un piston movil. Las paredes del cilindro pueden ser manipuladas de manera de tornarlo
totalmente adiabatico o de permitir el intercambio de calor con las fuentes. El piston es movil y
puede conectarse a la fuente de trabajo.
El ciclo de Carnot se lleva a cabo en cuatro pasos. Las transformaciones termodinamicas del
sistema auxiliar se muestran en los diagramas de la figura 6.
El sistema auxiliar, originalmente a la misma temperatura que el sistema primario (la fuente
caliente), es puesto en contacto con dicho reservorio y con la fuente de trabajo. Se induce
entonces una transformacion A B a temperatura constante Tc cambiando alg
un parametro
extensivo del sistema. En el caso de un gas esto corresponde a una expansion isotermica.
En este proceso el sistema absorve calor del reservorio caliente y entrega cierta cantidad de
trabajo a la fuente reversible.
Se retira el reservorio pero se deja el sistema en contacto con la fuente de trabajo. El sistema
auxiliar lleva a cabo entonces una expansion adiabatica B C hasta que su temperatura
decae hasta el valor Tf del reservorio frio. Durante esta etapa del proceso el sistema entrega
adiabaticamente una cantidad extra de trabajo a la fuente, con lo cual esta transformacion
ocurre a entropa constante.

Termodinamica y Mecanica Estadstica I - Notas 2016

48

P
A

Tc

B
Tc

B
W

Tf

D
D

SA

Tf

SB

Figura 6: Ciclo de Carnot


El sistema se pone en contacto con el reservorio frio y se comprime isotermicamente hasta
que su entropa alcanza el valor inicial SA . Durante esta fase hay una transferencia de trabajo
desde la fuente reversible de trabajo al sistema y una transferencia de calor del sistema al
reservorio frio. Esta es la etapa C D.
Se desconecta el sistema del reservorio y se comprime adiabaticamente hasta su vol
umen inicial
completando el ciclo D A. Durante esta fase el sistema absorve una cantidad adicional de
trabajo de la fuente, alcanzando su temperatura inicial.
El calor extraido de la fuente caliente en el paso 1 es Tc S y el calor entregado a la fuente fria
en el paso 3 es Tf S. Durante los otros dos pasos el sistema no intercambia calor. Asi, la diferencia
entre los calores absorvido y entregado (Tc Tf )S es igual al trabajo neto entregado a la fuente
de trabajo en el ciclo completo. El trabajo neto viene entonces dado por el area encerrada por el
rectangulo ABCD en el diagrama T S, en tanto que el calor entregado por la fuente caliente
viene dado por el area del rectangulo ABSA SB . La eficiencia termica viene dada por el cociente de
estas areas, y es igual a
=1

Tf
.
Tc

Este resultado es el mismo que habamos obtenido para un proceso diferencial entre dos temperaturas instantaneas. El hecho de trabajar entre dos reservorios hace que la eficiencia del proceso
infinitesimal sea constante e igual a la eficiencia global. Si las fuentes de calor fueran meramente
fuentes reversibles en lugar de reservorios, el calculo de la eficiencia global del proceso debe llevarse
a cabo integrando sobre todos los pasos infinitesimales. Si bien hemos ejemplificado el ciclo de
Carnot mediante un gas, el mismo ciclo puede realizarse con cualquier sistema auxiliar, variando
de manera controlada alg
un parametro extensivo, alternando dos transformaciones adiabaticas y

Termodinamica y Mecanica Estadstica I - Notas 2016

49

dos isotermicas. Un ejemplo sera la magnetizacon de un sistema magnetico. En este sentido, el


diagrama T S del ciclo es completamente general e independiente del sistema auxiliar, en tanto
que otros diagramas (tal como el P V de la figura 6) dependen de la ecuacion de estado del
sistema particular.
Es importante notar lo siguiente. Los intercambios de calor entre el sistema auxiliar y los reservorios ocurren a temperatura constante. De esta manera el incremento de entropa en cualquier
parte del proceso es cero, con lo cual el proceso completo es reversible, y la maquina puede
perfectamente ser operada en reversa.
El ciclo de Carnot tiene enorme importancia teorica por diversos motivos. Por un lado esta construccion conceptual tuvo un papel muy importante en el desarrollo historico de la termodinamica,
ya que a traves de esta surgio el concepto de entropa.
Por otro lado, si bien es un proceso absolutamente teorico (y como veremos mas adelante,
absolutamente irrealizable en la practica), la eficiencia de este proceso nos da una cota superior
para la de cualquier maquina termica que funcione entre dos reservorios de temperatura, tal como
es el caso de las usinas termicas.
Finalmente, como ya mencionamos algunos captulos antes, el ciclo de Carnot nos provee un
metodo operacional para medir la temperatura, basado en primeros principios. Dado que la eficiencia termica esta definida en terminos de flujos de calor y de trabajo, esta es en principio una
cantidad directamente medible. Dado que = 1 Tf /Tc , esto implica que el cociente de temperaturas entre dos sistemas cualesquiera es una cantidad medible, con un valor definido. El hecho
de que la cantidad medible sea el cociente entre las temperaturas es equivalente a decir que la
temperatura esta determinada a menos de un factor arbitrario. Este factor puede elegirse de manera convencional asignando un valor arbitrario a un sistema de referencia. Midiendo entonces la
eficiencia de una maquina de Carnot que funciona entre el sistema de referencia y cualquier otro,
podemos medir la temperatura de este u
ltimo.

5.7.

M
aquinas endo-reversibles

El criterio de maxima eficiencia termica no es el u


nico importante en el dise
no de maquinas
termicas reales. Otras consideraciones, tales como la potencia de salida (esto es, la velocidad de
entrega de energa de la maquina) o el costo son tanto o mas importantes en una aplicacion practica
y en general entran en conflicto.
Consideremos el caso de una maquina que opera entre dos reservorios de temperatura a Tc
y Tf , tal como es el caso de una usina termica. Sabemos que la maxima eficiencia es obtenida
mediante una maquina reversible. Supongamos que esta maquina opera de acuerdo al ciclo de
Carnot y consideremos el primer paso del ciclo, en el cual el sistema auxiliar se encuentra a la
misma temperatura del reservorio caliente. Estrictamente esta maquina no funciona, ya que si ambos
sistemas se encuentran a la misma temperatura no habra flujo de calor! Por otro lado, si el sistema
auxiliar se encuentra a menor temperatura que el reservorio, el flujo de calor ocurre de manera
irreversible, a
un siendo cuasiestatico. De esta manera disminuye la eficiencia. La manera de resolver
este problema en la maquina de Carnot es hacer la diferencia de temperaturas infinitamente
peque
na. Pero esto resulta en un proceso infinitamente lento, con lo cual la potencia de salida
sera infinitamente peque
na.
Para obtener una potencia de salida razonable la extraccion de calor del resorvorio caliente y
la injeccion en el reservorio frio tiene que ser hecha de manera irreversible. Una m
aquina endoreversible se define como una en la cual los u
nicos procesos irreversibles en el ciclo son los que
involucran intercambio de calor con los reservorios termicos.
Vamos a analizar un caso simple de este tipo de maquina. Asumamos que el ciclo continua
constituido por dos transformaciones adibaticas y dos isotermicas alternadas, como en el ciclo de
Carnot, solo que las transformaciones isotermicas ocurren a dos temperaturas intermedias T1 y
T2 entre Tc y Tf , tal como se muestra en la figura 7. Esto es, durante la expansion isotermica el

Termodinamica y Mecanica Estadstica I - Notas 2016

50

Figura 7: Ciclo de una maquina endo-reversible


sistema se mantiene a una temperatura T1 < Tc y durante la compresion isotermica el sistema se
mantiene a una temperatura T2 > Tf , de tal manera que Tc > T1 > T2 > Tf . Asi, el calor fluye
del reservorio caliente al fluido a traves de una diferencia de temperatura Tc T1 , y del fluido al
reservorio frio a traves de T2 Tf . Cada uno de estos procesos es irreversible, y por lo tanto el ciclo
completo es irreversible (ya vimos que el flujo de calor cuasi-estatico entre dos sistemas a diferentes
temperaturas es siempre irreversible). El sistema absorve en un ciclo una cantidad de calor Qc del
reservorio a Tc y entrega una cantidad Qf al reservorio Tf , de tal manera que la diferencia entre
estas cantidades nos da el trabajo entregado a la fuente reversible de trabajo. Asumiendo que estos
procesos ocurren de manera aproximadamente cuasi-estatica, el trabajo W viene dado por el area
del rectangulo en el diagrama T S de la figura 7. De esta manera, las cantidades Qc , Qf y W
se relacionan entre s a traves de la eficiencia de una maquina de Carnot que funcione entre las
temperaturas T1 y T2 , esto es

T2
W = 1
T1

Qc

(200)

T2
Qc
T1

(201)

Qc =

T1
W
T1 T2

(202)

Qf =

T2
W
T1 T2

(203)

Qf =
o bien

Se sabe que la velocidad de flujo de calor entre dos sistemas a diferentes temperaturas es
proporcional al gradiente de temperatura (ley de Fourier). Asi, podemos asumir que, si tc es el
tiempo total requerido para transferir Qc del reservorio caliente al fluido, entonces
Qc
= c (Tc T1 ),
tc

Termodinamica y Mecanica Estadstica I - Notas 2016

51

donde c es la conductancia t
ermica de la pared que separa ambos sistemas (el producto de la
conductividad termica por el area de la pared dividido el espesor). Para el flujo de calor del sistema
al reservorio frio tendremos una relacion semejante. Asi, el tiempo consumido por el sistema durante
las dos transformaciones isotermicas sera
t = tc + tf =

Qf
1 Qc
1
+
.
c Tc T1 f T2 Tf

El tiempo requerido para las transformaciones adiabaticas esta determinado por los tiempos de
relajacion del fluido, los cuales son relativamente cortos. Mas a
un, estos tiempos pueden ser disminuidos bastante mas mediante un dise
no apropiado de las dimensiones del cilindro y los pistones.
Asi, podemos asumir que el tiempo consumido en los procesos adiabaticos es despreciable frente a
tc + tf . Usando entonces las expresiones (202) y (203) tenemos que el tiempo total del ciclo puede
aproximarse por
"

1
T1
1
1
T2
1
t = tc + tf =
+
. W
c T1 T2 Tc T1 f T1 T2 T2 Tf
La potencia de salida de la maquina es P = W/t. Esta potencia es funcion de las temperaturas
T1 y T2 . Si estas temperaturas son muy cercanas a las de los reservorios el trabajo W aumenta,
ya que se aproxima al de una maquina reversible. No obstante en este caso el tiempo del proceso
se incrementa, de manera que la potencia tiende a cero. Por el contrario, si las temperaturas de
trabajo se alejan de las de los reservorios de manera que T1 T2 0, el trabajo entregado tiende a
cero, como puede verse del diagrama T S de la figura 7, y por lo tanto la potencia tambien tiende
a cero. La potencia maxima se obtendra entonces para alg
un valor intermedio de las temperaturas.
Estos valores pueden obtenerse maximizando la potencia como funcion de T1 y T2 , esto es, las
temperaturas optimas seran las soluciones de
P
P
=
= 0.
T1
T2
Mediante un algebra un poco extensa se obtiene que las soluciones optimas son
p

T1 = c(Tc , Tf ) Tc

(204)

T2 = c(Tc , Tf ) Tf

(205)

p
c Tc + f Tf
c(Tc , Tf ) =

c + f

(206)

donde

y la potencia maxima es
"

Pmax = c f

Tc + Tf

c + f

#2

(207)

La eficiencia termica de la maquina viene dada por

Tf 1/2
T2
=1
=1
(208)
T1
Tc
Notemos que, si bien menor que para una maquina reversible, la eficiencia de esta maquina
solamente depende de las temperaturas de los reservorios.
Este ciclo teorico aproxima bastante bien el funcionamiento grandes usinas, tal como puede
apreciarse de la tabla 1

Termodinamica y Mecanica Estadstica I - Notas 2016


usina
carbon (Gran Breta
na)
nuclear (Canada)
geotermica (Italia)

Tf [o C]
25
25
80

Tc [o C]
565
300
250

(Carnot)
0,64
0,48
0,32

52
(ER)
0,40
0,28
0,17

(observada)
0,36
0,30
0,16

Cuadro 1: Eficiencias termicas comparadas de diferentes usinas termicas

5.8.

Otros procesos cclicos

En maquinas termicas peque


nas, tales como motores de vehculos, al menos una de las fuentes
termicas es finita, en lugar de un reservorio (la fuente fria es en general la atmosfera, pudiendo
por lo tanto considerarse un reservorio). La fuente caliente es en general una mezcla de gases en
combustion. Asi, estas maquinas funcionan en base a ciclos termicos diferentes del ciclo de Carnot
y la maquina endo-reversible.
El ciclo Otto constituye una aproximaci
on idealizada de la operacion de los motores a base
de gasolina. Estos motores constan de varios cilindros, los cuales ejecutan de manera sincronizada
una secuencia pasos. Cada cilindro consta de un piston, el cual se mueve entre dos vol
umenes fijos
V1 < V2 . En la base opuesta al piston hay dos valvulas llamadas de admisi
on y escape, y una buja
que produce una chispa electrica. Al cociente V1 /V2 se lo denomina la raz
on de compresi
on. La
secuencia de operaciones es la siguiente:
La valvula de escape se cierra y la de admision se abre. El posicion inicial del piston corresponde al vol
umen V1 . El piston se mueve hacia la posicion correspondiente al vol
umen V2 ,
aspirando una mezcla de vapor de gasolina y aire. Esta operacion se conoce como admisi
on.
Al final de este paso la valvula de admision se cierra.
El piston se mueve hacia la posicion correspondiente al volumen V1 , comprimiendo la mezcla. Este proceso es aproximadamente adiabatico, y en el mismo aumentan la presion y la
temperatura de la mezcla. Esta operacion se conoce como compresi
on.
La buja produce una chispa, con lo cual la mezcla entra en combusti
on, es decir, se produce
una reaccion qumica exotermica a vol
umen constante, produciendose una mezcla consistente
principalmente de dioxido de carbono, vapor de agua y nitrogeno. Esta es la fase de ignici
on.
El piston se mueve hacia la posicion correspondiente al volumen V2 , como resultado de la
alta presion de la mezcla. Esta expansion es aproximadamente adiabatica. Esta es la fase de
potencia.
La valvula de escape se abre y el piston regresa a la posicion del volumen V1 expulsando los
gases calientes a la atmosfera. Esta es la fase de escape.
Al final de este proceso la valvula de escape se cierra y recomienza el ciclo. Los distintos cilindros
se encuentran ligados por un cigue
nal, el cual sincroniza los movimientos, de manera que cuando
algunos pistones suben en las fases de admision y potencia otros bajan en las fases de compresion
y escape.
El analisis termodinamico de la maquina real es bastante complejo por varios motivos. Primero,
durante la ignicion la reaccion qumica provoca que los n
umeros de moles de la mezcla cambien, de
manera que no trabajamos con un u
nico fluido. En particular, esto hace que la capacidad calorfica
de la mezcla cambie durante el proceso. Segundo, las transformaciones adiabaticas claramente
no son cuasiestaticas y ciertamente no son isoentr
opicas. No obstante esto, podemos considerar
una version idealizada del ciclo, en la cual todas las transformaciones son cuasiestaticas y donde
suponemos que hay una u
nica sustancia activa. Este ciclo se representa en la figura 8. Las fases

Termodinamica y Mecanica Estadstica I - Notas 2016

53

C
SC

W
D

SB

A
A
V1

V1

V2

V2

Figura 8: Ciclo Otto


de compresion y potencia se representan por las transformaciones adiabaticas A B y C
D respectivamente. La fase de ignicion se representa por la transformacion isocora B C. La
fase de admision puede considerarse que no participa del ciclo termodinamico, ya que el piston
practicamente no realiza trabajo. De esta manera, las fases de admision y escape se representan
conjuntamente en los diagramas, ya que ambas resultan equivalentes a enfriar un u
nico fluido
a vol
umen constante, poniendolo en contacto con un reservorio frio (la atmosfera). Esta versi
on
idealizada es conocida como ciclo Otto y nos da una perpectiva aproximada del funcionamiento de
las maquinas reales.
La eficiencia termica de un ciclo Otto, donde el fluido activo es un gas ideal, puede calcularse
facilmente, siendo

Otto = 1

V1
V2

(cp cv )
cv

Este resultado nos indica que el fator determinante en la eficiencia de una maquina de este
tipo es la razon de compresion, lo cual ciertamente vale tambien para maquinas reales. En la
practica la razon de compresion esta limitada por las propiedades del combustible. Existe una
temperatura maxima que un combustible puede alcanzar sin explotar expont
aneamente. Si se supera
esta temperatura el combustible explota por simple compresion. Si la razon de compresion es tal que
esta temperatura se alcanza antes de completar la fase de compresion el combustible explota antes
de la chispa y el motor pierde sincronizacion, con la consiguiente perdida de eficiencia. Este efecto
de ignicion por simple compresion o detonaci
on es aprovechado en los motores a base de gasoil
(un combustible con una temperatura de ignicion espont
anea relativamente baja) cuya operacion
se describe en forma aproximada por el ciclo Diesel.
El ciclo Diesel ideal se muestra en el diagrama P V de la figura 9. En una maquina Diesel
durante la admision se introduce u
nicamente aire en el cilindro, el cual se comprime adiabaticamente
en la transformacion A B. La razon de compresion se elige suficientemente alta de manera que el
aire en el punto B alcanza una temperatura bastante alta. En el punto B se injecta el combustible,

Termodinamica y Mecanica Estadstica I - Notas 2016

54

P
PC

S = SC
W
D

S = SA
A

VA

Figura 9: Ciclo Diesel


el cual explota inmediatamente ya que la temperatura del aire se encuentra por encima de su
temperatura de ignicion. A partir de ahi la mezcla de gases se expande mientras el combustible se
continua injectando a una velocidad tal que la expansion ocurre a presion constante. Este proceso
se representa en el diagrama por la curva B C. Una vez alcanzado el punto C cesa la injeccion
de combustible y la mezcla continua su expansion de manera aproximadamente adiabatica, hasta
alcanzar el volumen maximo del cilindro. Finalizado este proceso la valvula de escape se abre y el
piston expulsa los productos de la combusti
on y absorve aire recomenzando el ciclo. Esta u
ltima
fase se representa por la transformacion isocora D A, al igual que en el ciclo Otto. La eficiencia
termica del ciclo Diesel depende de una manera mas complicada que en el ciclo Otto de la razon
entre los tres vol
umenes involucrados en el ciclo, pero en general a igual razon de compresion la
eficiencia del ciclo Diesel es menor que la del Otto.
Finalmente, vamos a describir el ciclo teorico de Stirling, el cual se muestra en la Fig.10 y
consta de dos tranformaciones isotermicas a temperaturas Tc y Tf respectivamente y dos transformaciones isocoras a vol
umenes Vmin y Vmax . La estructura basica del motor de Striling se muestra
esquematicamente en la Fig.11. El motor consta de dos pistones separados por un dispositivo conocido como regenerador. Este tiene la capacidad de absorver y ceder calor en las transformaciones
a volumen constante. En el interior del cilindro se encuentra un gas, que vamos a asumir ideal
(tpicamente aire). Inicialmente el piston de la derecha se encuentra en un extremo, con el gas a
temperatura Tf y volumen Vmax , mientras que el piston de la izquierda se encuentra junto al regenerador. El regenerador se supone cargado, es decir, con energa interna suficiente par entregar
calor al gas. Del punto (1) al (2) el gas se comprime isotermicamente a Tf hasta Vmin , entregando una cantidad de calor Qf a la fuente fria. Del punto (2) al (3) los dos pistones se mueven
sincronizadamente hasta que todos el gas pasa al cilindro de la derecha, produciendo una transformacion isocora. A lo largo de este proceso, el gas extrae una cantidad de calor Q0 del regenerador
aumentando su temperatura, de tal manera que al finalizar el proceso el gas se encuentra a temperatura Tc . Del punto (3) al (4) el gas se expande isotermicamente en el cilindro de la izquierda
hasta alcanzar Vmax . En esta fase absorve una cantidad de calor Qc de la fuente caliente y realiza
trabajo, mientras que el piston de la derecha permanece junto al regenerador. Finalmente, de (4) a
(1) los dos pistones se mueven sincronizadamente hacia la derecha, haciendo pasar el gas a traves

Termodinamica y Mecanica Estadstica I - Notas 2016

55

Figura 10: Ciclo de Stirling


del regenerador hasta que todo el gas se encuentra en el cilidro de la derecha. Este es un proceso
a volumen constante Vmax , durante el cual el gas entrega una cantidad de calor Q00 al regenerador
aumentando su energa interna, de manera que al finalizar el proceso el gas se encuentra a Tf ,
cerrando el ciclo.
Analicemos la eficiencia del ciclo, suponiendo un gas ideal. Tenemos que = W/Qabs , donde
W = Qabs Qent . As
=

Qc + Q0 (Qf + Q00 )
Qc Qf
=
0
Qc + Q
Qc + Q0

ya que Q0 = Q00 = N cv (Tc Tf ), por corresponder a dos transformaciones isocoras entre las
mismas temperaturas. Ahora bien, si el regenerador funciona correctamente, el calor Q0 solo se
entrega al sistema la primera vez que se ejecuta el ciclo. De ahi en adelante, se recupera en forma
interna y por lo tanto no aporta al calor absorvido. As,
=1

Qf
.
Qc

Para un gas ideal tenemos que

Vmax
V
min
Vmax
= N R Tf ln
Vmin

Qc = N R Tc ln
Qf

de manera que la eficiencia es la misma que la de un ciclo de Carnot = 1Tf /Tc . Si el regenerador
no trabaja, el motor lo mismo funciona pero la eficiencia es menor y viene dada por

=1

R Tf ln
R Tc ln

Vmax
Vmin
Vmax
Vmin

+ cv (Tc Tf )
+ cv (Tc Tf )

(209)

Este ciclo es de gran interes, ya que permite alcanzar la eficiencia termica que mas se aproxima
al ciclo de Carnot. Por otra parte, el mismo permite construir motores de combusti
on externa
en los cuales el sistema auxiliar circula en un circuito cerrado entre dos camaras mantenidas a
temperaturas Tc y Tf .

Termodinamica y Mecanica Estadstica I - Notas 2016

56

Figura 11: Ciclo de operaciones del motor de Stirling


Si bien la eficiencia termodinamica es alta y el costo de fabricacion es bajo, estos motores tienen
la desventaja de una baja potencia de salida, por lo cual no son aptos para propulsar vehculos.
Sin embargo, el hecho de que la fuente de la cual absorve calor sea externa permite aplicaciones
interesantes en el aprovechamiento de fuentes de energa no convencionales (ej., solar).

Termodinamica y Mecanica Estadstica I - Notas 2010

6.
6.1.

56

Formulaciones alternativas - Transformada de Legendre


El Principio de Mnima Energa

Hemos visto hasta ahora solo algunas de las consecuencias inmediatas del principio de maxima
entropa. Entre las mas importantes podemos mencionar las condiciones de equilibrio termodinamico, la irreversibilidad intrseca de toda transformacion espontanea y el teorema de maximo trabajo,
con las consecuencias derivadas para el funcionamiento de maquinas termicas. Un analisis mas profundo nos mostrara una serie de otros resultados de gran profundidad e importancia, tanto teorica
como practica.
No obstante, el analisis de los problemas que veremos en breve resulta sumamente complejo con
la estructura presente del formalismo. Es asi que resulta importante investigar si el mismo contenido
de la teora puede ser reformulado de diferentes formas matem
aticas equivalentes. Conocemos
de la mecanica clasica como este enfoque puede resultar enormemente poderoso: los formalismos
Newtoniano, Lagrangiano y Hamiltoniano son enteramente equivalentes entre s; no obstante, un
problema que es practicamente trivial en uno de estos formalismos puede resultar extremadamente
complejo de analisar en otro o vice versa. En particular, uno de los aspectos que vuelven este
enfoque poderoso es la posibilidad de elegir las variables fundamentales de la teora como aquellas
que aparecen de manera natural en un problema particular. En mecanica esto se traduce en el
uso de coordenadas generalizadas. Este mismo principio se aplica en termodinamica. En la
representacion entropa las variables fundamentales son los parametros extensivos del sistema, en
tanto que los parametros intensivos aparecen como magnitudes dependientes. En muchos problemas
los parametros intensivos aparecen como variables independientes naturales. Hemos visto ya en
varios problemas como transformar de un conjunto de variables independientes a otras involucra un
tratamiento delicado de las ecuaciones de estado, oscureciendo el analisis del problema. Resultara
entonces mucho mas claro y sencillo disponer de una formulaci
on alternativa equivalente en la
cual dichas variables naturales apareciesen desde un principio como las variables independientes.
Veremos como estas diferentes formulaciones resultan casi cruciales en la termodinamica, tal vez
en un grado mayor que en la mecanica. Es asi como la teora general de las transformaciones entre
diferentes representaciones equivalentes puede ser considerada como un aspecto fundamental de la
teora termodinamica.
De hecho ya hemos considerado dos representaciones equivalentes: la representaci
on entropa y
la representacion energa. No obstante, existe hasta ahora una asimetra entre ambas representaciones: el principio variacional para la determinacion de los estados de equilibrio ha sido formulado
solamente en la representacion entropa. Si realmente estas dos representaciones son enteramente
equivalentes, es decir, si ambas contienen exactamente la misma informacion termodinamica, tiene
que existir un principio variacional en la representaci
on energa que juegue un rol analogo al principio de maxima entropa. De hecho este principio existe. El principio de m
axima entropa es
equivalente a, y puede ser reemplazado por, un principio de mnima energa. Mientras que el
principio de maxima entropa caracteriza los estados de equilibrio como aquellos que maximizan
la entropa para una energa total dada (la cual es constante como resultado de que el sistema
esta cerrado) el principio de mnima energa caracteriza los estados de equilibrio como aquellos que
minimizan la energa para una entropa total fija.
Podemos entender geometricamente esta equivalencia entre ambos principios si recordamos que
la hipersuperficie definida por la relacion fundamental de un sistema compuesto en el espacio de
configuraciones termodinamicas tiene propiedades de concavidad bien definidas. Sin perdida de
generalidad, consideremos la relacion fundamental de un sistema compuesto por dos subsistemas
monocomponentes separados por una pared rgida, impermeable y adiabatica, la cual tornaremos
diatermica:
S = S (1) (U (1) ) + S (2) (U (2) ) = S (1) (U (1) ) + S (2) (U U (1) ) = S(U, U (1) ).

Termodinamica y Mecanica Estadstica I - Notas 2010

57

Figura 11: El estado de equilibrio A corresponde tanto a un maximo de S a U = U0 = cte como a


un mnimo de U a S = S0 = cte.
El espacio de configuraciones tiene entonces 3 dimensiones y la relacion fundamental define una
superficie bidimensional, como se muestra en la Fig.11. Cuando la pared se vuelve diatermica, el
nuevo estado de equilibrio se encuentra entonces en la curva definida por la intersecci
on de la
superficie entropa con el plano vertical U = U0 = cte dado por la condicion de clausura. Esta
curva tiene un maximo en un punto A, correspondiente a una entropa S0 . Este punto determina
el valor de U (1) correspondiente al estado de equilibrio. Miremos ahora el corte de la superficie con
el plano S = S0 = cte, el cual define otra curva. Por la propiedades de concavidad de la superficie
resulta evidente que esta curva tiene un mnimo en el punto A. Esto es, el estado de equilibrio es
a la vez el maximo de la curva definida por U = U0 y el mnimo de la curva definida por S = S0 .
Esta equivalencia se basa en la forma de la superficie, la cual esta determinada por los postulados
basicos de la termodinamica. Si bien todava no lo hemos realmente demostrado, vamos a enunciar
claramente los dos principios variacionales equivalentes:
Principio de M
axima Entropa: El estado de equilibrio de cualquier parametro interno no
restringido por un vnculo es tal que maximiza la entropa para un dado valor de la energa
interna total.
Principio de Mnima Energa: El estado de equilibrio de cualquier parametro interno no
restringido por un vnculo es tal que minimiza la energa para un dado valor de la entropa
total.
La equivalencia entre ambos principios puede ser probada matematicamente o bien formulada
en terminos fsicos. Vamos a comenzar con el argumento fsico, demostrando que si la energa no
es un mnimo la entropa no puede ser un maximo en equilibrio y vice versa.
Supongamos entonces que el sistema esta en equilibrio pero que la energa no tiene el mnimo
valor consistente con el valor de la entropa total dada. Pensemos en terminos de la representaci
on
entropa, en la cual la energa es una variable independiente y el estado de equilibrio esta completamente caracterizado por los valores de los parametros U, V, N1 , . . .. Podemos entonces extraer
energa del sistema en forma de trabajo, sin cambiar la entropa del sistema, llevando asi la energa
a su valor mnimo. A continuacion podemos reingresar esta energa al sistema en forma de calor. Al
hacer esto el sistema es restituido a su estado de equilibrio original, pero con una entropa mayor

Termodinamica y Mecanica Estadstica I - Notas 2010

58

(dS = d0 Q/T ). Pero esto es inconsistente con el principio de que el estado de equilibrio corresponde al maximo de entropa para una energa dada. Debemos entonces concluir que el sistema
en equilibrio se encuentra en un mnimo de la energa para una entropa dada.
Veamos ahora el argumento inverso. Asumamos el principio de mnima energa y supongamos
que el sistema esta en equilibrio, pero que su entropa no tiene el valor maximo compatible con la
energa del sistema. En este caso conviene utilizar la representaci
on energa, en la cual el estado de
equilibrio esta determinado por las variables S, V, N1 , . . .. Pongamos ahora el sistema en contacto
con una fuente reversible de calor y una fuente reversible de trabajo, de tal manera que el sistema
extraiga una cantidad de calor Q de la fuente de calor y entregue una cantidad W a la fuente de
trabajo, tal que Q + W = 0. La cantidad de calor Q es tal que la entropa del sistema alcanza
el valor maximo, sin cambiar la energa. El trabajo almacenado en la fuente reversible puede ser
ahora utilizado para extraer la misma cantidad de calor Q del sistema y entregarlo a la fuente de
calor operando una maquina termica (un refrigerador), de tal manera que la entropa del sistema
vuelve a su valor original. El sistema se encuentra entonces en su estado de equilibrio original, pero
con una energa menor ya que entrego calor pero no realizo trabajo, y esto es incompatible con el
principio de mnima energa.
Veamos ahora el argumento matematico formal. Asumamos el principio de maxima entropa,
esto es

S
X

=0

2S
X 2

<0
U

donde por claridad hemos escrito X en lugar de U (1) y donde esta implcito que todos los otros
parametros extensivos se mantienen constantes. Sea U = U (S, X) la inversa de S = S(U, X),
donde todos los demas parametros extensivos se asumen constantes. Vamos a denotar por D a
(U/X)S . Queremos relacionar D con las derivadas de S. Juguemos un poco entonces con las
derivadas. Tenemos las dos relaciones fundamentales S = S(U, X) y U = U (S, X), una inversa de
la otra. Si S = S0 = cte, las variables U y X no son mas independientes y la relacion U = U (S0 , X)
describe una curva en el espacio (U, X). A lo largo de esta curva tenemos que

S
X

dS =

S
U

dX +
U

dU = 0
X

pero

dU =

U
X

dX
S

de donde

S
X

+
U

S
U

U
X

dX = 0
S

y asi

U
X

=
S

S
X U

S
U X

= T

S
X

= 0.

(210)

de manera que U tiene un extremo si el sistema esta en equilibrio. Para determinar que tipo de
extremo tenemos que analizar la derivada segunda

2U
X 2

=
S

D
X

.
S

(211)

Termodinamica y Mecanica Estadstica I - Notas 2010

59

En la representacion entropa D = D(U, X), pero para S = cte, U y X no son independientes


y D = D(U (X), X). Asi,

D
X

=
S

D
U

U
X

D
X

+
S

=D
U

D
U

+
X

D
X

(212)

y para D = 0

2U
X 2

=
S

D
X

(213)
U

S

X U

S
X
U X U
2
S

S
X 2 U
+
S
X U
U X

(214)
2S
XU
2
S
U X

(215)

Pero en el extremo (S/X)U = 0, de manera que

2U
X 2

= T
S

2S
X 2

> 0.

(216)

U tiene entonces un mnimo. El argumento inverso es totalmente simetrico.


La situacion de caracterizar un mismo estado por dos principios variacionales tiene su analogo en
geometra. Un crculo puede ser caracterizado como la figura plana de mayor area para un mismo
permetro o como la figura de menor permetro a igual area. Los dos criterios alternativos que
caracterizan el crculo son enteramente equivalentes y se aplican a cualquier crculo. No obstante,
estas dos caracterizaciones sugieren dos metodos diferentes de generar un crculo. Podemos tomar
un cuadrado y deformar el contorno manteniendo el area constante, tal como si el contorno estuviera
constituido por una banda elastica. El contorno entonces se va a contraer hasta alcanzar el menor
permetro, generando un crculo. Alternativamente podemos pensar el contorno como siendo una
cuerda de longitud constante. El area se va a expandir hasta generar otro crculo. Cada uno de
estos crculo (diferentes) satisface ambas condiciones extremales. Es decir, un mismo crculo puede
ser generado por ambos procedimientos, partiendo de una figura con la misma area final o con el
mismo permetro final.
La situacion correspondiente en un sistema termodinamico es enteramente analoga. Un estado
de equilibrio puede ser caracterizado como el de maxima entropa para una dada energa o como
el de mnima energa a entropa constante. Pero estos dos criterios sugieren dos maneras diferentes
de alcanzar el equilibrio. Tomemos por ejemplo un piston adiabatico fijo en cierta posicion de un
cilindro, separando dos subsistemas, y queremos calcular el estado de equilibrio de este sistema sin
el vnculo. Podemos simplemente remover el vnculo manteniendo el sistema cerrado y permitir que
el estado de equlibrio se alcance espontaneamente hasta que las temperaturas y las presiones se
igualen. La entropa aumenta y la energa se conserva. Este es el procedimiento sugerido por el principio de maxima entropa. Alternativamente podemos permitir que el piston se mueva lentamente,
realizando trabajo en forma reversible sobre un agente exterior, hasta que las temperaturas y las
presiones se igualen. Durante este proceso la entropa se mantiene constante y la energa del sistema
disminuye. Este es el procedimiento sugerido por el principio de mnima energa. Si partimos del
mismo estado inicial, por supuesto alcanzaremos estados de equilibrio diferentes. No obstante, al
igual que en el caso del crculo, un mismo estado de equilibrio puede ser obtenido por cualquiera
de los dos procedimientos, partiendo de otro estado con la misma energa o la misma entropa que

Termodinamica y Mecanica Estadstica I - Notas 2010

60

el estado final. Esto es, independientemente de por cual de los dos procesos se alcance el equilibrio,
o por cualquier otro proceso diferente, el estado final satisface ambas condiciones extremales.
Finalmente, vamos a ilustrar el uso del principio de mnima energa, usandolo en lugar del
principio de maxima entropa para obtener las condiciones de equilibrio termico. Tomemos un
sistema compuesto cerrado, con una pared interna rgida, impermeable y diatermica. El calor fluye
entre ambos subsistemas y deseamos encontrar el estado de equilibrio. Planteado de esta manera, el
problema parece ser resoluble solo en la representaci
on entropa, ya que la energa total del sistema
es constante. No obstante esto, veremos que a
un asi podemos usar el principio de mnima energa
para encontrar el estado de equilibrio.
En la representacion energa la relacion fundamental es
(1)

(2)

U = U (1) (S (1) , V (1) , N1 , . . .) + U (2) (S (2) , V (2) , N1 , . . .)

(217)

y las variables a determinar son S (1) y S (2) , ya que todas las restantes variables son constantes.
Ahora, nosotros conocemos el valor total de U pero no el de S total. Sin embargo sabemos que
s el sistema tuviera el valor maximo de S total (el cual no conocemos) y s permitieramos cambios
virtuales en la energa, esta siempre aumentara respecto de su valor en el estado de equilibrio. En
este caso el cambio virtual en la energa total viene dado por
dU = T (1) dS (1) + T (2) dS (2) .

(218)

El principio de mnima energa establece que dU = 0 sujeto a la condicion:


S (1) + S (2) = cte
y por lo tanto
dU = (T (1) T (2) )dS (1) = 0

(219)

T (1) = T (2) ,

(220)

de donde

esto es, la misma condicion fsica obtenida mediante el principio de maxima entropa. No obstante,
matematicamente existe una diferencia. La ecuacion (220) es para las variables S (1) y S (2) , la cual
debera complementarse con S (1) + S (2) = Stotal . No obstante no concemos el valor de Stotal . Pero
ya que conocemos Utotal podemos utilizar la Ec.(217), la cual conjuntamente con la (220) permiten
la solucion completa del problema.
La determinacion de las condiciones de equilibrio al remover otros tipos de vnculos se resuelve
de manera analoga.

6.2.

Transformadas de Legendre

Tanto en la representacion entropa como en al representaci


on energa las variables independientes son los parametros extensivos, mientras que los parametros intensivos son variables dependientes. En la mayora de las situaciones experimentales de interes ocurre lo contrario. Normalmente
los parametros intensivos, temperatura, presion, etc., son cantidades facilmente controlables y medibles, en tanto que los parametros extensivos aparecen como cantidades dificiles (cuando no imposibles, como en el caso de la magnetizacion) de controlar y/o medir. Pensemos, por ejemplo, en el par
de variables conjugadas temperatura-entropa. No existe ning
un instrumento practico de medicion
directa de la entropa, en tanto que termometros y termostatos son equipamientos corrientes y altamente desarrollados. De este modo, los parametros intensivos aparecen en muchas situaciones como
las variables independientes naturales. Sera entonces importante disponer de otras formulaciones

Termodinamica y Mecanica Estadstica I - Notas 2010

61

10

Figura 12:
alternativas equivalentes en las cuales en la relaci
on fundamental uno o mas de los parametros
intensivos aparezcan como variables independientes. Siempre existe por supuesto la posibilidad de
invertir las ecuaciones de estado. No obstante, como ya vimos anteriormente, esto obliga a trabajar
con todas las ecuaciones de estado simultaneamente, a fin de no perder informacion. Disponer de una
relacion fundamental con todo el contenido de informaci
on de la termodinamica del sistema, en la
cual parametros intensivos aparezcan como variables independientes, nos permitira una formulaci
on
mucho mas clara de los problemas y menos sujeta a errores, a
un cuando ambos procedimientos son
enteramente equivalentes.
En terminos formales el problema puede ser planteado como sigue. Tenemos una relacion fundamental de la forma
Y = Y (X0 , X1 , . . . , Xt )

(221)

y desamos encontrar un metodo mediante el cual las derivadas


Pk

Y
Xk

puedan ser consideradas como variables independientes sin sacrificar nada del contenido de informacion de la Ec.(221), esto es, deseamos encontrar una funcion alternativa de uno o mas de los
parametros intensivos, a partir de la cual siempre podamos reconstruir la Ec.(221). Este es un problema conocido en geometra, y se presenta tambien en otros campos de la fsica. Vamos a presentar
la solucion geometrica del problema general y luego adaptarla al problema termodinamico.
Vamos a comenzar con el caso mas simple de una funcion de una u
nica variable independiente
X:
Y = Y (X).

(222)

Termodinamica y Mecanica Estadstica I - Notas 2010

62

10

Y
4

0
0

Figura 13:
Esta funcion se representa geometricamente por una curva el el espacio (X, Y ) (figura 12) y la
derivada
dY
= P (X)
(223)
dX
nos da la pendiente de la curva en cada valor de X. Si ahora deseamos considerar P como una variable independiente, el primer impulso es despejar X como funcion de P de la Ec.(223) y reemplazarla
en la Ec.(222). No obstante, rapidamente nos damos cuenta que al hacer esto hemos sacrificado
parte de la informacion contenida en la Ec.(222), ya que, desde el punto de vista geometrico es
evidente que el conocimiento del valor de Y como funcion de la derivada dY /dX no nos permite
reconstruir la funcion Y = Y (X). De hecho, cada una de las curvas desplazadas horizontalmente
de la figura 13 corresponde a la misma relacion Y = Y (P ). Desde el punto de vista analtico, la
relacion Y = Y (P ) es una ecuacion diferencial de primer orden del tipo y = f (y 0 ), cuya integraci
on
nos da Y = Y (X) a menos de una constante de integraci
on indeterminada. De este modo, al aceptar
Y = Y (P ) como una relacion fundamental, estamos perdiendo parte de la informacion contenida
en Y = Y (X).
Este problema puede ser resuelto si notamos que una misma curva en el plano puede ser definida
de dos maneras: (i) como el conjunto de puntos cuyas coordenadas satisface la relacion Y = Y (X) o
bien como (ii) la envolvente de una familia de rectas tangentes a la curva. Si conocemos la relacion
Y = Y (X) evidentemente podemos escribir la ecuacion de la recta tangente en cualquier punto.
Conversamente, como veremos enseguida, si conocemos la ecuacion para cada una de las rectas
pertenecientes a la familia podemos reobtener la relacion Y = Y (X).
Es importante comprender que, asi como cualquier punto del plano esta descripto por dos
n
umeros (X, Y ), cualquier recta del plano esta tambien descripta por dos n
umeros (P, ), donde
P es la pendiente y la ordenada al orgen. Asi, tal como una relacion funcional Y = Y (X)
P

Termodinamica y Mecanica Estadstica I - Notas 2010

63

Y(X)

Figura 14:
selecciona un subconjunto de todos los posibles puntos (X, Y ), una relacion funcional del tipo
= (P ) selecciona un subconjunto particular de todas las posibles rectas en el plano (P, ). Si
conocemos la ordenada al origen de cada una de las rectas tangentes en funcion de su pendiente P
podemos construir la familia de rectas y por lo tanto la funcion envolvente. Por lo tanto la relacion
= (P )
es completamente equivalente a la relacion fundamental Y = Y (X). En esta relacion P es la variable
independiente y por lo tanto es la solucion buscada al problema, esto es, = (P ) constituye
tambien una relacion fundamental.
Veamos como calcular (P ) a partir de Y (X). La operacion matematica que nos lleva de una
funcion a la otra se conoce como transformaci
on de Legendre. Consideremos la recta tangente
a la curva en un punto particular (X, Y ) cuya tangente es P . Si es la intersecci
on de la recta con
el eje Y (ver figura 14) tenemos que
P =

Y
X

(224)

o bien
= Y PX

(225)

Supongamos ahora que disponemos de la funcion Y (X). Derivando obtenemos


P = P (X)
de donde invirtiendo podemos obtener X = X(P ). Reemplazando entonces en la Ec.(225) obtenemos la relacion

Termodinamica y Mecanica Estadstica I - Notas 2010

64

(P ) = Y [X(P )] P X(P ).

(226)

La Ec.(226) define lo que se conoce como la transformada de Legendre de la funcion Y (X).


Veamos ahora el problema inverso de obtener Y (X) si conocemos (P ). Supongamos que efectuamos una variacion infinitesimal dP . Calculemos las diferencial correspondiente de . De la Ec.(226)
tenemos que
d = dY [X(P )] P dX(P ) X(P )dP.

(227)

Pero
dY =

dY
dX = P dX
dX

y asi
d = XdP
de donde
d
.
(228)
dP
Invirtiendo esta relacion podemos obtener P = P (X) y reemplazando en la Ec.(225) llegamos a la
transformaci
on inversa:
X = X(P ) =

Y (X) = [P (X)] + XP (X),

(229)

esto es, para cada recta tangente de pendiente P podemos calcular el valor de la abcisa X en la
cual la curva toca la recta y a partir de este obtener el valor de la correspondiente coordenada Y .
Vemos que, excepto por los signos, ambas transformaciones son simetricas.
La generalizacion de la transformada de Legendre a funciones de varias variables es directa. La
relacion fundamental en este caso describe una hipersuperficie en t + 2 dimensiones. Esta hipersuperficie puede ser descripta tanto como el conjunto de puntos en el espacio de configuraciones que
satisface la relacion fundamental, como tambien siendo la envolvente de un conjunto de hiperplanos
tangentes. Cada uno de dichos hiperplanos puede ser descripto a traves de su intersecci
on con el
~ (X0 , X1 , . . . , Xt )
eje Y en funcion de las pendientes Pk que describen el hiperplano. Llamemos X
a las coordenadas de un punto arbitrario en el espacio de configuraciones. Tomemos ahora un pun~ 0 , al cual corresponde un punto sobre la hipersuperficie Y (X
~ 0 ). La ecuacion del
to particular X
hiperplano tangente a la hipersuperficie en dicho punto es
~ = Y (X
~ 0 ) + Y (X
~ 0 ).(X
~ X
~ 0 ).
Z(X)
Tenemos entonces que la interseccion = Z(0) del hiperplano con el eje Y viene dada por
t
X

= Y (X0 , . . . , Xt )

Pk Xk .

(230)

k=0

A partir de las derivadas parciales


Pk (X0 , . . . , Xt ) =

Y
Xk

podemos obtener la coordenadas en funcion de las pendientes Xk = Xk (P0 , . . . , Pt ) y reemplazando


en la Ec.(230) obtenemos la transformada de Legendre

Termodinamica y Mecanica Estadstica I - Notas 2010

65

(P0 , . . . , Pt ) = Y (X0 (P0 , . . . , Pt ), . . . , Xt (P0 , . . . , Pt ))

t
X

Pk Xk (P0 , . . . , Pt ).

(231)

k=0

Tomando la diferencial de esta ecuacion tenemos que


d = dY

Pk dXk

Xk dPk .

(232)

pero
dY =

Pk dXk

de donde
d =

Xk dPk

y por lo tanto
Xk =

.
Pk

(233)

Invirtiendo estas ecuaciones podemos calcular la transformada inversa reemplazando en la ecuacion


Y =+

t
X

P k Xk .

(234)

k=0

Finalmente la transformada de Legendre puede ser llevada a cabo en un subespacio de n + 2


variables del espacio completo, conteniendo la variable Y y digamos las n + 1 primeras variables
Xk (k = 0, 1, . . . , n). En este caso las restantes variables pueden ser consideradas como constantes
en la transformacion. La relacion fundamental obtenida de esta manera sera funcion de n + 1
parametros intensivos P0 , . . . , Pn y de t n par
ametros extensivos Xn+1 , . . . , Xt (la numeraci
on
de las variables aqui es por supuesto arbitraria). Vamos a adoptar la notacion Y [P0 , . . . , Pn ] para
designar la transformada de Legendre de la funcion Y = Y (X0 , . . . , Xt ) con respecto a las variables
X0 , . . . , Xn . Esta sera funcion del conjunto de variables P0 , . . . , Pn , Xn+1 , . . . , Xt y su diferencial
viene dada por
dY [P0 , . . . , Pn ] =

n
X

t
X

Xk dPk +

k=0

Pk dXk

(235)

k=n+1

de donde
Xk =
Pk =

Y [P0 , . . . , Pn ]
Pk

Y [P0 , . . . , Pn ]
Xk

para
para

kn
k>n

(236)
(237)

Antes de aplicar estos conceptos a la termodinamica vamos a repasar brevemente su aplicacion en la mecanica clasica. El formalismo Lagrangiano nos dice que la dinamica de todo sistema
mecanico esta completamente caracterizado por el Lagrangiano, el cual es cierta funcion de 2r
variables, r de las cuales corresponden a las coordenadas generalizadas y r corresponden a velocidades generalizadas. Asi, la funcion

Termodinamica y Mecanica Estadstica I - Notas 2010

66

L(v1 , . . . , vr , q1 , . . . , qr )
cumple el papel de una relacion fundamental. Se definen los momentos generalizados como
Pk

L
.
vk

A fin de expresar la relacion fundamental en terminos de los momentos generalizados se toma


entonces la transformada de Legendre con respecto a las velocidades, la cual se conoce como el
Hamiltoniano:
r
X

(H) L[v1 , . . . , vr ] = L

P k vk

k=1

la cual constituye una nueva relacion fundamental


H = H(P1 , . . . , Pr , q1 , . . . , qr ).
Mas a
un, de las relaciones derivadas anteriormente tenemos que
vk =

(H)
H
=
,
Pk
Pk

la cual constituye una de las ecuaciones dinamicas de Hamilton.

6.3.

Potenciales Termodin
amicos

La aplicacion de la transformada de Legendre al formalismo termodinamico es inmediata. Podemos tomar cualquiera de las relaciones fundamentales vistas hasta ahora (en la representaci
on entropa y en la representacion energa) y aplicar la transformada de Legendre con respecto a uno
o mas de los parametros extensivos. Las transformadas mas habituales en termodinamica son las
de la energa U = U (S, X1 , . . . , Xt ), a las cuales se conoce con el nombre generico de Potenciales
Termodin
amicos o Energas Libres. Vamos entonces a definir los potenciales mas usados.
Se define el potencial de Helmholtz o energa libre de Helmholtz como la transformada
parcial de Legendre de U con respecto a S y se lo denota en general con la letra F , esto es
F U [T ].
El potencial de Helmholtz es entonces funcion de las variables T, V, N1 , . . . y la relacion funcional
F = F (T, V, N1 , . . .)
constituye una realcion fundamental equivalente a las anteriores. Tenemos entonces que, a partir
de la relacion fundamental
U = U (S, V, N1 , . . .)
calculamos
T = T (S, V, N1 , . . .) =

U
;
S

invirtiendo esta relacion obtenemos S = S(T, V, N1 , . . . , Nr ), de donde resulta

Termodinamica y Mecanica Estadstica I - Notas 2010

67

F (T, V, N1 , . . .) = U (S(T, V, N1 , . . .), V, N1 , . . .) T S(T, V, N1 , . . .)


o sinteticamente
F = U TS
cuya diferencial es
dF = SdT P dV + 1 dN1 + + r dNr .
En esta representacion T aparece como una variable independiente, en tanto que S aparece como
una magnitud derivada, dada por

S =

F
T

.
V,N1 ,...

Las restantes derivadas parciales se obtienen de la relacion diferencial. Resulta interesante comparar
las diferentes ecuaciones de estado que se obtienen en diferentes representaciones en relacion a los
mismos parametros intensivoes. Asi, por ejemplo, tenemos que

U
= P (S, V, N1 , . . .)
=
V S,N1 ,...

F
=
= P (T, V, N1 , . . .)
V T,N1 ,...

(238)
(239)

Se define la Entalpa H como la transformada de Legendre de la energa que reemplaza el


volumen por la presion:
H U [P ] = H(S, P, N1 , . . .)
la cual se obtiene de
H = U + PV
donde V = V (S, P, N1 , . . . , Nr ) se obtiene de invertir
P =

U
.
V

La diferencial total de H viene dada por


dH = T dS + V dP + 1 dN1 + + r dNr .
En esta representacion P aparece como una variable independiente, en tanto que el volumen aparece
como una magnitud derivada, dada por

V =

H
P

.
S,N1 ,...

El potencial o energa libre de Gibbs se define como la trasformada de la energa que


reemplaza simultaneamente la entropa y el volumen por la temperatura y la presion como variables
independientes, esto es

Termodinamica y Mecanica Estadstica I - Notas 2010

68

G U [T, P ] = G(T, P, N1 , . . .)
la cual se obtiene a partir de la expresion
G = U TS + PV
en donde S = S(T, P, , N1 , . . .) y V = V (T, P, , N1 , . . .) se obtienen de invertir las relaciones
P =

T =

U
= P (S, V, N1 , . . .)
V

U
= T (S, V, N1 , . . .).
S

La diferencial completa de esta funcion viene dada por


dG = SdT + V dP + 1 dN1 + + r dNr
y la entropa y el volumen se obtienen de

S=

V =

G
T

G
P

.
P,N1 ,...

.
T,N1 ,...

Alternativamente, G puede obtenerse como la transformada de F con respecto a V : G = F + P V


o bien como la transformada de H con respecto a S: G = H T S.
Estos son los potenciales que aparecen con mayor frecuencia en la temodinamica. Para sistemas
monocomponente se suele definir el potencial gran can
onico, el cual surge naturalmente en la
mecanica estadstica. Este se define como la transformada de Legendre de U que reemplaza a la
entropa y el n
umero de moles por la temperatura y el potencial qumico, esto es, U [T, ]. No existe
una notacion standard para este potencial, cuyas variables naturales son T, V, .
Supongamos que intentamos obtener la transformada de Legendre de U con respecto a todas
sus variables, esto es
U [T, P, 1 , . . .] = U T S + P V 1 N1
Por la relacion de Euler
U = T S P V + 1 N1 +
tenemos que dicha transformada se anula identicamente. Esto significa que la intersecci
on de todos
los hiperplanos tangentes a la hipersuperficie completa en el espacio de configuraciones es siempre
cero. Esto es una particularidad de los sistemas termodinamicos.

Termodinamica y Mecanica Estadstica I - Notas 2010

6.4.

69

Funciones de Massieu

Mientras que las transformadas de Legendre mas usadas en termodinamica son las que presentamos en la seccion anterior, se puede definir otro conjunto de transformadas a partir de la relacion
fundamental para la entropa S = S(U, V, N1 , . . .). Estas transformadas se denominan genericamente como funciones de Massieu, para distinguirlas de los potenciales termodinamicos, los
cuales se obtienen de transformar la energa interna.
Las funciones de Massieu mas representativas son S[1/T ], en la cual la energa interna se reemplaza por la inversa de la temperatura como variable independiente; S[P/T ], en la cual el volumen
se reemplaza por P/T como variable independiente y S[1/T, P/T ] en la cual ambos reemplazos son
hechos simultaneamente. Tenemos que

1
1
F
S
S U =
T
T
T

P
P
S
S V
T
T

1 P
1
P
G
S
,
S U V = .
T T
T
T
T

(240)
(241)
(242)

Vemos que de las tres, la u


nica que no se relaciona trivialmente con alg
un potencial termodinamico
es S[P/T ]. La diferencial completa de esta funcion es

dS[P/T ] =

1
T

P
dU V d
T

1
dN1 +
T

y las magnitudes obtenidas a traves de derivadas parciales surgen de esta expresion.

Termodinamica y Mecanica Estadstica I - Notas 2010

7.

70

Principio variacional en las representaciones transformadas de


Legendre

Hemos visto que la transformacion de Legendre permite expresar la relacion fundamental en


terminos de cualquier combinacion de variables de estado independientes (extensivas o intensivas), de acuerdo con la conveniencia del problema a tratar. Hemos visto ademas como el principio
variacional (II postulado) tiene su expresion propia en la representaci
on energa. Dado que las
transformadas de Legendre contienen exactamente la misma informacion que las relaciones fundamentales en las representaciones entropa y energa, el principio variacional debe tener tambien su
expression en estas nuevas representaciones.

7.1.

El Potencial de Helmholtz

Consideremos un sistema compuesto en contacto con un reservorio termico a temperatura T r y


supongamos que un vnculo interno del sistema es removido. Vamos a analizar bajo que condiciones
podemos predecir el estado final de equilibrio. Para ello vamos a trabajar en la representaci
on
energa.
En el equilibrio, la energa total del sistema compuesto mas el reservorio es un mnimo, esto es,
ante variaciones infinitesimales de las variables de estado del sistema y el reservorio:
d(U + U r ) = 0

(243)

d2 (U + U r ) = d2 U > 0

(244)

d(S + S r ) = 0

(245)

sujeto a la condicion

donde en la Ec.(244) hemos usado que d2 U r = 0, ya que d2 U r es una suma de terminos de la forma
2U r
dXjr dXkr ,
Xjr Xkr
de la homogeneidad de la relacion fundamental se concluye que las derivadas segundas son funciones
homogeneas de grado 1, con lo cual varan como la recproca del n
umero de moles del reservorio (queda como ejercicio al lector mostrarlo) y por lo tanto se anulan. Ademas de la condicion
(245) debemos considerar otras condiciones de clausura, las cuales dependen del vnculo particular
del sistema compuesto. Por ejemplo, si tenemos una pared movil e impermeable separando dos
subsistemas, tendremos que
(1)

dNj

(2)

= dNj

= d(V (1) + V (2) ) = 0 j

(246)

La diferencial dU en la Ec.(243) involucra los terminos T (1) dS (1) + T (2) dS (2) , que provienen
del intercambio de calor de los subsistemas entre s y con el reservorio, y terminos de trabajo
que dependen del vnculo particular; para el ejemplo anterior de la pared movil e impermeable,
tendremos P (1) dV (1) P (2) dV (2) . Los terminos T (1) dS (1) +T (2) dS (2) se combinan con dU r = T r dS r
en la Ec.(243) dando
T (1) dS (1) + T (2) dS (2) + T r dS r = (T (1) T r )dS (1) + (T (2) T r )dS (2) = 0
y por lo tanto

Termodinamica y Mecanica Estadstica I - Notas 2010

T (1) = T (2) = T r

71

(247)

Las restantes condiciones de equilibrio dependen del vnculo particular, pero no ofrecen ninguna
novedad. Mas a
un, hasta aqui solo hemos repasado la aplicacion del principio de mnima energa
para el caso de un sistema compuesto en contacto con un reservorio, obteniendo la condicion
bastante evidente de que el reservorio impone su temperatura a todo el sistema. Vamos a reformular
a continuacion las Ecs.(243)-(245) en el lenguaje de las nuevas representaciones. Vamos a reescribir
la Ec.(243) como
d(U + U r ) = dU + T r dS r = 0

(248)

y usando la Ec.(245) y que T r es constante


dU T r dS = d(U T r S) = 0

(249)

Dado que T r es una constante y S es una variable independiente, tenemos que d2 (T r S) = 0 y


por lo tanto podemos escribir la Ec.(244) como
d2 (U T r S) > 0

(250)

As, la cantidad (U T r S) tiene un mnimo en el estado de equilibrio. Recordemos que F (T, X1 , . . .) =


U T S. Esta cantidad no tiene un mnimo absoluto para cualquier temperatura. Sin embargo, si
aceptamos la condicion evidente de que en el equilibrio la temperatura del sistema es igual a la del
reservorio, bajo dicha situacion los estado accesibles del sistema estaran restrictos al subespacio de
estados correspondiente a T = T r . Pero en dicho subespacio F es identico a U T r S y por lo tanto
dF = d(U T S) = 0

(251)

d2 F = d2 (U T S) > 0

(252)

T = Tr

(253)

con la restriccion

Por lo tanto, el estado de equilibrio minimiza el potencal de Helmholtz, no de manera absoluta,


mas sobre el subespacio de estados dado por la condicion T = T r . As, arribamos al:
Principio variacional en la representaci
on de Helmholtz: El estado de equilibrio de
un sistema compuesto en contacto diatermico con un reservorio de calor minimiza el potencial de
Helmholtz sobre el subespacio de estados para los cuales T = T r .
El significado intuitivo de este principio es claro. En equilibrio la energa del sistema mas la del
reservorio es mnima. La afirmacion de que el potencial de Helmholtz del sistema es un mnimo es
otra manera de decir lo mismo, ya que en la Ec.(251) el termino d(T S) representa el cambio de
energa del reservorio (T = T r y dS = dS r ).
Es importante recalcar que el este principio variacional solo vale si el sistema completo (esto
es, todos los subsistemas) se encuentra a temperatura constate (esto es, en contacto con un
reservorio). Mas a
un, el potencial de Helmholtz de un sistema compuesto solo es aditivo sobre sus
subsistemas en dichas condiciones. Para ver mas claro esto, consideremos dos subsistemas 1 y 2
completamente aislados entre s. Para cada uno de ellos tendremos una relacion fundamental U (i) =
~ (i) ) con i = 1, 2. Para cada uno de ellos podemos calcular su potencial de Helmholtz
U (i) (S (i) , X
(i)
~ =
F
= U (i) T (i) S (i) , donde T (i) = U (i) /S (i) . Para el sistema total tendremos U (S, X)

Termodinamica y Mecanica Estadstica I - Notas 2010

72

~ = X
~ (2) + X
~ (2) . A
U (1) + U (2) , donde S = S (1) + S (2) y X
un podemos calcular la transformada
de Legendre de la energa total U respecto de la entropa total S, esto es, F = U T S, donde
T = U/S. Sin embargo, cuando los dos subsistemas estan completamente aislados, este parametro
T no representa ninguna temperatura concreta, ya que en general T 6= T (1) 6= T (2) . De esta manera,
F 6= F (1) + F (2) , a menos que T (1) = T (2) = T .
En la practica muchos procesos son llevados a cabo en recipientes rgidos con paredes diatermicas, de manera que la atmosfera act
ua como un reservorio termico. El potencial de Helmholtz
brinda una representacion perfectamente adecuada para esta situacion. Desde el punto de vista
analtico, F tiene como variables naturales (esto es, independientes) T, V, N1 , N2 , . . .. La condicion
de T constante simplemente reduce el n
umero de variables del problema, tornando F un funcion
u
nicamente de las variables V, N1 , N2 , . . .. Esto es bien diferente del tratamiento que deberamos
dar al problema si usaramos la condicion T = cte en la representaci
on energa. En dicho caso, U
es funcion de las variables S, V, N1 , N2 , . . ., pero dichas variables no son independientes, ya que
T = T (S, V, N1 , N2 , . . .) = cte impone una relacion entre ellas, con la complicacion obvia que esto
implica.
Como ejemplo de lo anterior, consideremos el problema de determinar el estado de equilibrio
de dos subsistemas simples en contacto entre s por una pared movil, adiabatica e impermeable,
todo en contacto con un resevorio a temperatura T r . Una vez removido el vnculo que mantiene la
pared fija, el problema es determinar los vol
umenes finales de equilibrio V (1) y V (2) . La aplicacion
del principio variacional en la representaci
on de Helmholtz nos lleva directamente a la condicion
(1)

(2)

P (1) (T r , V (1) , N1 , . . .) = P (2) (T r , V (2) , N1 , . . .)


(1)

(254)

(2) ,

la cual es una ecuacion para las variables V


yV
ya que los restantes parametros permanecen
(1)
(2)
constantes. La condicion de clausura V
+V
= V = cte nos da la ecuacion restante que
permite resolver el problema. Si resolvieramos el problema en la representaci
on energa, tambien
obtendramos la condicion de la igualdad de presiones, solo que en este caso las mismas seran
funciones de las entropas y vol
umenes de cada subsistema. Tendramos entonces 4 incognitas a
resolver y necesitamos dos ecuaciones mas. Estas ecuaciones vienen dadas por T (i) (S (i) , V (i) , . . .) =
T r para i = 1, 2. Pasar a la representacion de Helmholtz nos permite reducir el n
umero de ecuaciones
a resolver de cuatro a dos. Si ademas quisieramos conocer los valores de las entropas de cada
subsistema, una vez resuelto el problema en la representaci
on de Helmholtz, estas pueden obtenerse
por derivacion directa:

S (i)

F (i)
=
T

!
(i)

(i)

= S (i) (T r , V (i) , N1 , . . .) i = 1, 2

V (i) ,N1 ,...

Mas importante desde el punto de vista conceptual, es que esta representaci


on nos permite
focalizar el problema exclusivamente en el sistema de interes, relegando el reservorio a un plano
implcito. Por otra parte, la representacion de Helmholtz aparece de manera natural en la Mecanica
Estadstica.
Finalmente, consideremos un sistema en contacto con un reservorio de calor que a la vez puede
intercambiar trabajo con una fuente reversible de trabajo. El trabajo entregado a dicha fuente es
igual al decremento en la energa interna del sistema mas la del revservorio d0 W = dU dU r .
Asumiendo que el intercambio con el reservorio es quasiestatico (y por lo tanto reversible, ya que
el sistema se encuentra a la misma temperatura que el reservorio), tenemos que
d0 W = dU T r dS r = d(U T r S) = dF

(255)

Por lo tanto, el trabajo entregado en un proceso reversible en contacto con un reservorio termico
es igual al decremento en el potencial de Helmholtz del sistema. Esto es lo que da orgen a los
nombres de potencial o energa libre al mismo.

Termodinamica y Mecanica Estadstica I - Notas 2010

7.2.

73

La Entalpa

Las mismas consideraciones de la seccion anterior pueden aplicarse a los otros potenciales termodinamicos. Consideremos un sistema compuesto, en el cual todos los subsistemas estan en contacto con un reservorio externo de presion, a traves de paredes no restrictivas respecto del vol
umen,
y supongamos que se remueve un vnculo interno del sistema. En la representaci
on energa la condicion de equilibrio Ec.(243) puede ser escrita como
d(U + U r ) = dU P r dV r = dU + P r dV = d(U + P r V ) = 0

(256)

Si seguimos los mismos pasos que en la seccion anterior, llegaremos a la condicion evidente de
que la presion del sistema (igual para todos los subsistemas) es P = P r . As
dH = d(U + P V ) = 0

(257)

P = Pr

(258)

sujeto a la restriccion

Mas a
un, dado que P r es constante y V una variable independiente
d2 H = d2 (U + P r V ) = d2 U > 0

(259)

y por lo tanto llegamos al


Principio variacional en la representaci
on Entalpa: El estado de equilibrio de un sistema
compuesto en contacto con un reservorio de presion minimiza la Entalpa sobre el subespacio de
estados de presion constante (P = P r ).
La entalpa posee la propiedad interesante de actuar como un potencial de calor. Consideremos
un sistema simple mantenido a presion constante por paredes impermeables. De la forma diferencial
dH = T dS + V dP +

k dNk

(260)

resulta que dH = d0 Q, esto es, el calor absorbido por un sistema a presion constante y a valores constantes de los restantes parametros extensivos (excepto S y V ) equivale al incremento de
entalpa.
Para ilustrar un posible uso de esta propiedad, supongamos que un sistema simple monocomponente cambia su vol
umen de un valor inicial Vi a un valor final Vf manteniendo la presion constante
y queremos calcular el calor absorbido en el proceso. Sabemos que el mismo es igual al cambio en
la entalpa:
Z

d0 Q = Hf Hi

Si conocemos la relacion fundamental H = H(S, P, N ), podemos calcular


V =

H
= V (S, P, N )
P

Invirtiendo esta u
ltima ecuacion, podemos expresar S y por lo tanto H como funcion de V , P y N
y calcular
Q = H(Vf , P, N ) H(Vi , P, N )

Termodinamica y Mecanica Estadstica I - Notas 2010

7.3.

74

El Potencial de Gibbs

Finalmente, consideremos un sistema en contacto simult


aneo con un reservorio de calor y uno
de presion. Repitiendo los pasos anteriores tenemos
d(U + U r ) = dU T r dS + P r dV = 0

(261)

lo cual nos llevara a las condiciones T = T r y P = P r , con lo cual


dG = d(U T S + P V ) = 0

(262)

sujeto a las restricciones


T = Tr

P = Pr

(263)

y
d2 G = d2 (U T r S + P r V ) > 0

(264)

y por lo tanto llegamos al


Principio variacional en la representaci
on de Gibbs: El estado de equilibrio de un sistema
compuesto en contacto con un reservorio termico y uno de presion minimiza el potencial de Gibbs
sobre el subespacio de estados de presion y temperatura constantes (T = T r y P = P r ).
Notemos que por la relacion de Euler U = T S P V +
G=U T S+P V =
Si dividimos por N

P
k

k Nk , el potencial de Gibbs resulta

k Nk

(265)

Nk , tenemos
X
G
=
k xk
N
k

(266)

donde xk = Nk /N son las fracciones molares. Para un sistema monocomponente tenemos


G
=
(267)
N
de donde el potencial qumico se denomina potencial de Gibbs molar. Notemos que la relacion
de Gibbs-Duhem d = s dT + v dP , no es mas que la expresion de la diferencial de g, ya que
s = (g/T )P y v = (g/P )T .
g(T, P )

Termodinamica y Mecanica Estadstica I - Notas 2010

8.

75

Relaciones de Maxwell

Seg
un algunos autores, luego de formulados los cuatro postulados basicos todo lo que sigue en la
termodinamica no es mas que un ejercicio de derivaci
on parcial. Si bien esta es una posicion exagerada, tiene algo de verdad. En la resolucion de practicamente cualquier problema termodinamico
uno se enfrenta al calculo de derivadas parciales de diferentes parametros termodinamicos respecto
de otros. Para sistemas con un n
umero grande de grados de libertad, el n
umero posible de tales
derivadas es enorme. No obstante, estas derivadas no son todas independientes, como vimos al
principio de la materia. As, por ejemplo, hemos visto como de la igualdad

U
S

U
V

se desprende que

T
V

S,N

P
=
S

(268)
V,N

Relaciones de este tipo, que resultan de la igualdad entre derivadas segundas cruzadas de una
relacion fundamental, se conocen como relaciones de Maxwell. Dado un potencial termodinamico expresado en terminos de sus t + 1 variables naturales, tendremos t(t + 1)/2 pares diferentes de
derivadas segundas cruzadas. Cada potencial termodinamico genera por lo tanto t(t + 1)/2 relaciones de Maxwell. Tomemos por ejemplo un sistema simple monocomponente y consideremos la
representacion energa. La energa interna es funcion de tres variables S, V y N (t=2):
dU = T dS P dV + dN
y por lo tanto tendremos tres relaciones de Maxwell. Si consideramos las derivadas respecto del par
S y V tenemos la relacion (268); si consideramos las derivadas respecto del par S y N :

T
N

=
S,V

;
V,N

si consideramos las derivadas respecto del par V y N :

P
N

=
S,V

.
S,N

Tomemos ahora como ejemplo la relacion fundamental en la representaci


on de Helmholtz F =
F (T, V, N ), donde
dF = S dT P dV + dN
Si consideramos las derivadas respecto del par T y V :

S
V

=
T,N

P
T

;
V,N

si consideramos las derivadas respecto del par T y N :

S
N

=
T,V

;
V,N

si consideramos las derivadas respecto del par V y N :

=
T,V

.
T,N

En forma semejante pueden obtenerse relaciones de Maxwell para los diferentes potenciales
termodinamicos.

Termodinamica y Mecanica Estadstica I - Notas 2010

8.1.

76

Reducci
on de derivadas parciales en sistemas monocomponentes

Aplicaciones practicas de la termodinamica en situaciones experimentales a menudo requieren el


calculo de una derivada en particular. Por ejemplo, podemos estar interesados en calcular el cambio
de temperatura necesario para mantener constante el vol
umen de un sistema monocomponente ante
un incremento peque
no de la presion. Este cambio viene dado por

dT =

T
P

dP
V,N

Derivadas de este tipo estan relacionadas con derivadas segundas de alguna relacion fundamental. Para el caso de sistemas monocomponente tendremos 6 de dichas derivadas independientes (las tres derivadas segundas respecto de los parametros termodinamicos independientes y las
tres derivadas cruzadas). Si ademas trabajamos a n
umero de moles constantes (una situacion frecuente experimentalmente) el n
umero de derivadas independientes se reduce a tres. De esta manera,
cualquier derivada de variables de estado respecto de otras puede ser expresada en terminos de un
conjunto arbitrario de tres derivadas basicas independientes. Este conjunto se elije convencionalmente como: cp , y T . Esta eleccion es una transformacion implcita a la representaci
on de Gibbs,
ya que:

cp = T
1
=
v

s
T

v
T

2g
T 2

= T
P

=
P

1 2g
v T P

(recordemos que v = g/P ) y


T =

1
v

v
P

=
T

1 2g
v P 2

Todas las derivadas primeras que involucran parametros intensivos y extensivos pueden ser
escritas en terminos de derivadas segundas del potencial de Gibbs. En este sentido, cp , y T
constituyen un conjunto completo a n
umero de moles constantes. Vamos a ver un procedimiento
general para expresar una derivada arbitraria en terminos de estas tres. Recordemos primero las
identidades:

X
Y
X
Y
X
Y

=
Z

Y
X
X
W

(269)

Z
Z

Z
Y
X
Z
X Y

Y
W

(270)

(271)

El procedimiento se desarrolla en una serie de pasos.


1. Si tenemos derivadas respecto de potenciales, llevarlos uno a uno al numerador
mediante las identidades anteriores y eliminarlos. Ejemplo:

P
U

=
G

U
P

(272)
G

Termodinamica y Mecanica Estadstica I - Notas 2010

77

Si partimos de la representacion energa U = U (S, V ), es decir, U depende de P a traves de


S y V . As

U
P

U
S
U
+
S V P G
V

S
V
= T
P
P G
P G

V
P

(273)
G

(274)

El potencial de Gibbs puede ser llevado al numerador usando la identidad (271). Por ejemplo

S
P

G
P
S
G
S P

=
G

(275)

Pero recordemos que G = G(P, T ) y S = (G/T )P = S(T, P ); as, la condicion S = cte


establece una relacion implcita entre T y P . Por lo tanto

G
P

=
S

G
T

= S

T
P

T
P

+
S

G
P

(276)
T

+V

(277)

Por otra parte,

G
S

= S
P

T
S

(278)
P

Reemplazando en la Ec.(274) y trabajando en forma semejante las restantes expresiones


obtenemos:

P
U

= T

T
P

T
S P

N T cp

T
P

+P

T
P

T
V

+P V

T
P

V
S

(279)

donde hemos usado

T
S
T
V

=
P

=
P

S
T
V
T

T
N cp

1
V

1
P

De esta manera, hemos eliminado todos los potenciales termodinamicos de las expresiones.
Las derivadas que restan son de T respecto de P , ambas variables dependientes en la representaci
on de Gibbs. Veremos a continuaci
on como relacionarlas con , cp y T .

Termodinamica y Mecanica Estadstica I - Notas 2010

78

2. Si alguna derivada contiene la entropa llevarla al numerador e intentar eliminarla,


ya sea mediante una relaci
on de Maxwell, o bi
en mediante la Ec.(271) usando
W =T
Ejemplo:

T
P

=
S

S
P

T
S
T P

V
T P
N
T cp

v T
cp

(280)

donde hemos usado la relacion de Maxwell:

S
P

=
T

V
T

(proviene de las derivadas del potencial de Gibbs).


Ejemplo:
Consderemos la derivada (S/V )P . La relacion de Maxwell correspondiente (proveniente de la entalpa dH = T dS + V dP ) nos da

S
V

=
P

V
S

=
P

T
P

=
S

P
T

(281)
S

Usando la Ec.(271) en forma semejante al ejemplo anterior obtenemos:

S
V

cp
vT

=
P

(282)

Alternativamente, podemos llegar al mismo resultado aplicando directamente la Ec.(270)


tomando W = T
3. Si despues de todo esto ha quedado el vol
umen en alguna derivada, lo llevamos
al numerador; las derivadas restantes pueden ser expresadas en t
erminos de y
T . Ejemplo:

T
P

=
V

V
P
V
T

T =

4. Si en las expresiones aparece cv lo eliminamos usando la identidad (proveniente


tambi
en de las relaciones de Maxwell)
cv = cp

T v 2
T

(283)

5. Si una derivada contiene el potencial qumico, este puede ser eliminado utilizando
la relaci
on de Gibbs-Duhem: d = s dT + v dP . Ejemplo: calcular (/V )S .

d =

dV = s
S

T
V

dV + v
S

P
V

de donde

= s
S

T
V

+v
S

P
V

dV
S

Termodinamica y Mecanica Estadstica I - Notas 2010

79

Finalmente, usando todas la consideraciones anteriores en la Ec.(279) llegamos a

P
U

"

N cp V
P V 2
= V T
+ P T V
S
S

#1

(284)

A su vez, las ecuaciones de estado S = S(T, P ) y V = V (T, P ) pueden ser obtenidas por
integracion de las funciones respuesta.

8.2.
8.2.1.

Algunas aplicaciones
Compresi
on adiab
atica

Consideremos un sistema simple, monocomponente, encerrado por paredes adiabaticas. La temperatura y la presion inicial son conocidas y el sistema se comprime cuasiestaticamente, de manera
que la presion aumenta de un cierto valor inicial Pi a un valor Pf . Se trata de predecir los cambios
en los distintos parametros termodinamicos (temperatura, vol
umen, energa interna, etc). Siendo
un proceso cuasiestatico y adiabatico tenemos que la entropa permanece constante.
Consideremos primero el cambio en la temperatura. Supongamos que conocemos la relacion
fundamental (en cualquier representacion). Transformando Legendre podemos obtener la entalpa
H = H(S, P, N ) y derivando esta la ecuacion de estado T = T (S, P, N ). As
T = T (S, Pf , N ) T (S, Pi , N )
Supongamos que no conocemos la relacion fundamental, pero conocemos , cp y T . Si el cambio
en la presion es peque
no, tenemos que

dT =

T
P

dP
S,N

la cual se obtiene como

T
P

=
S,N

S
P

T,N
S
T P,N

vT
cp

(285)

El cambio fraccional en el vol


umen es proporcional a la compresibilidad adiabatica s , la cual
satisface:
s
cv
=
T
cp
donde cv se calcula de la Ec.(283). Otras cantidades se calculan de manera semejante.
8.2.2.

Compresi
on isot
ermica

Consideremos un sistema simple, monocomponente, que se comprime a temperatura y n


umero
de moles constantes, llevandolo de una presion inicial Pi a un valor final Pf . Para cambios peque
nos
en la presion tenemos que:

dS =

S
P

dP
T,N

Pero (relacion de Maxwell)

S
P

=
T,N

V
T

= V
P,N

Termodinamica y Mecanica Estadstica I - Notas 2010

80

As, la cantidad de calor transferida es


d0 Q = T dS = T V dP
Si y V se conocen en funcion de T y P , tenemos para un proceso finito
Q = T

Z Pf

V dP

Pi

Otra cantidad de interes puede ser

dU =

U
P

dP
T,N

Tenemos que

U
P

U
S
U
+
S V,N P T,N
V

S
V
= T
P
P T,N
P T,N

=
T,N

y as
dU = (T V + P V T ) dP

S,N

V
P

T,N

Termodinamica y Mecanica Estadstica I - Notas 2010

9.

81

Aplicaciones de los potenciales termodin


amicos

9.1.
9.1.1.

Enfriamiento y Licuefacci
on de gases
Efecto Joule (expansi
on libre)

Las partculas en todos los gases neutros interact


uan via un potencial que tiene una componente
repulsiva a distancias muy cortas (carozo duro) y una interacci
on atractiva a distancias mayores
que decae muy rapidamente con la misma. Si se deja que el gas se expanda, el mismo debe hacer
trabajo contra dichas fuerzas atractivas y por lo tanto la temperatura debe disminuir. Este efecto
puede ser aprovechado para enfriar un gas.
Consideremos entonces un gas encerrado en una camara rgida y adiabatica, con un vol
umen
inicial Vi a una temperatura Ti y una presion Pi . El recipiente se encuentra conectado a otra
camara a traves de una valvula, inicialmente cerrada. La segunda camara es evacuada. La valvula
se abre s
ubitamente y se deja expandir el gas libremente, con lo cual no hay trabajo neto W = 0.
Mas a
un, dado que ambas camaras estan aisladas, no hay flujo neto de calor Q = 0 y por lo
tanto la energa interna permanece contante U = 0 durante el proceso. El u
nico efecto de la
expansion libre es una transferencia entre la energa potencial y la energa cinetica de las partculas.
El proceso es claramente no cuasiestatico y la entropa aumenta aunque no haya flujo de calor.
Durante la expansion, no podemos usar la termodinamica para describir el estado del sistema, ya
que el mismo no se encuentra en equilibrio. Sin embargo, una vez finalizado el proceso el sistema
estara nuevamente en equilibrio y podemos elegir cualquier camino cuasiestatico para calcular los
cambios en los parametros termodinamicos entre los estados inicial y final. En particular, nos
interesa el cambio en la temperatura T = Tf Ti . Vamos a elegir un camino a energa constante
U y n
umero de moles constante que conecte los estados de vol
umenes Vi y Vf . A lo largo de dicho
camino tenemos

dT =

T
V

dV
U,N

La cantidad (T /V )U,N se conoce como el coeficiente de Joule. Tenemos que

T
V

=
U,N

U
V
U
T

T,N =
V,N

1
N cv

U
V

T,N

Para un gas ideal, (U/V )T,N = 0 y el coeficiente de Joule se anula. Un gas ideal no realiza
ningun tipo de trabajo (ni siquiera contra s mismo) y por lo tanto la temperatura no cambia. Para
el caso de un fluido de Van der Waals tenamos u = cRT a/v

U
V

=
T,N

a N2
V2

Asumiendo el valor del calor especfico de un gas ideal c = 3R/2 tenemos

T
V

=
U,N

2aN
3RV 2

(286)

Integrando la Ec.(286) entre los vol


umenes inicial y final podemos calcular el cambio relativo
de temperatura en la expansion:
2aN
T
=
Ti
3 R Ti

1
1

Vf
Vi

Como Vf > Vi la temperatura siempre disminuye. Para gases reales puede verse que esta disminucion es en general bastante peque
na (< 10 %), con lo cual el metodo no es muy efectivo.

Termodinamica y Mecanica Estadstica I - Notas 2010

82

Figura 15: Representacion esquematica del efecto Joule-Thompson.


9.1.2.

Efecto Joule-Thompson

Un metodo mucho mas efectivo que el anterior se basa en el llamado efecto Joule-Thompson
que veremos a continuacion, el cual es utlizado en la mayora de las maquinas criogenicas estandar.
En el metodo de Joule-Thompsson se hace escurrir un gas a traves de un tapon poroso, desde una
camara mantenida a alta presion a otra camara a baja presion, como se muestra en la Fig.(15).
Bajo ciertas circunstancias, que veremos a continuaci
on, el gas se enfra o se calienta al pasar a
traves del tapon. Esto es, dependiendo de las presiones inicial y final, existe una temperatura inicial
(llamada temperatura de inversion) por encima de la cual el cambio en temperatura es positivo y
por debajo de la cual el cambio es negativo. En el caso de enfriado, el gas puede ser reinyectado
en la camara de alta presion mediante una bomba mecanica, repitiendo el proceso hasta licuar el
gas. Para comenzar entonces el proceso es necesario enfriar previamente el gas por debajo de la
temperatura de inversion.
Ambas camaras se encuentran aisladas, de manera que el proceso global se asume adiabatico.
Al igual que en la expansion libre, el proceso no es cuasiestatico (irreversible) y por lo tanto no
podemos describir el estado del sistema durante el mismo mediante la termodinamica. Pero al
igual que antes, podemos determinar los estados de equilibrio inicial y final y buscar un camino
termodinamico que los conecte para calcular las variaciones en los parametros termodinamicos. El
trabajo total por mol del gas realizado por el piston que empuja es Pi vi ; el trabajo total por mol
realizado por el gas sobre el piston a baja presion es Pf vf . El trabajo neto realizado sobre el gas
es por lo tanto W = Pi vi Pf vf . Dado que Q = 0, el cambio en la energa interna por mol del gas
es u = W y por lo tanto
ui + Pi vi = uf + Pf vf
o
hi = hf
Podemos entonces elegir un camino isoent
alpico que una los estados inicial y final. No obstante,
hay que recalcar que esto es solo un artificio de calculo. Durante el proceso de expansion, el sistema
esta fuera del equilibrio y la entalpa ni siquiera esta definida.

Termodinamica y Mecanica Estadstica I - Notas 2010

83

Las curvas isoentalpicas en el espacio (T, P ) para gases reales muestran un maximo, de manera
que si partimos de una presion inicial a la derecha del mismo. un decremento de presion implica un
incremento de temperatura, mientras que ,si partimos de una presion a la izquierda del maximo. la
temperatura disminuye. El punto de maximo por lo tanto nos da la temperatura de inversi
on.
Para cambios peque
nos en la presion, podemos calcular el cambio de temperatura como:

dT =

T
P

dP
H,N

El coeficiente JT = (T /P )H,N se denomina coeficiente de Joule-Thompson y se puede expresar en terminos de cp y usando la tecnica de reduccion de derivadas que vimos en el captulo
anterior. As

T
P

=
H,N

H
P T,N

H
T P,N

(287)

Dado que H = H(S, P, N ) y T es una magnitud derivada en esta representaci


on,

H
P

=
T,N

H
S

H
T

P,N

S
P

=
P,N

H
P

+
T,N

H
S

P,N

S
T

=T
S,N

S
P

+V
T,N

P,N

= N cp

Usando la relacion de Maxwell

S
P

=
T,N

V
T

= V
P,N

obtenemos finalmente
JT =

v
(T 1)
cp

(288)

Esta es la ecuacion fundamental para el efecto Joule-Thompson. Para T > 1 un decremento


peque
no en la presion enfra el gas. La temperatura de inversi
on viene entonces dada por
Tinv = 1

(289)

Para un gas ideal = 1/T y por lo tanto no hay cambio de temperatura en la expansion
de Joule-Thompson, como era de esperar, ya que este efecto resulta de la interacci
on entre las
moleculas. A temperaturas suficientemente altas, el comportamiento de todos los gases aproxima
el del gas ideal, de manera que en esas condiciones no existe cambio de temperatura para ning
un
cambio de presion.

9.2.

Reacciones qumicas

En la seccion 2.6 analizamos las condiciones de equilibrio para una reaccion qumica descripta
por
r
X

j Aj *
)0

j=1

en la representacion entropa: La aplicacion del principio de maxima entropa sujeto al vnculo

Termodinamica y Mecanica Estadstica I - Notas 2010

84

dN1
dN2
dNr
=
= =
= d
1
2
r
o equivalentemente dNj = j d, nos llevo a la condicion de equilibrio
r
X

j j = 0

(290)

j=1

En la representacion entropa los potenciales qumicos son funciones del vol


umen y la energa
interna, variables que son apropiadas para un sistema cerrado. Sin embargo, la situacion experimental habitual es que las reacciones qumicas se lleven a cabo en un recipiente abierto a la atmosfera,
la cual actua como un reservorio de presion y temperatura a la vez. En estas circnstancias la representacion de Gibbs resulta particularmente apropiada. A temperatura y presion constantes tenemos
entonces que
dG =

j dNj = d

j j

de donde reobtenemos la condicion de equilibrio (290) con los potenciales qumicos en funcion de
T y P . Si los n
umeros de moles iniciales de las diferentes componentes son conocidos, la reaccion
se producira hasta cierto punto en que los n
umeros de moles asumiran los nuevos valores
Nj = Nj0 + j

(291)

De esta manera, la Ec.(290) es una u


nica ecuacion para la cantidad , la cual nos da una medida
de la cantidad de materia que ha intervenido en la reaccion. La cantidad
A() =

r
X

j j =

j=1

(292)
P,T

se conoce como afinidad. En equilibrio, tenemos entonces A() = 0. La solucion anterior al problema
es apropiada, en tanto haya suficiente cantidad inicial de cada componente que interviene en la
reccion. En otras palabras, los n
umeros de moles en la Ec.(291) no puede volverse negativos. El
maximo valor de para el cual todos los n
umeros molares son no negativos define la maxima
extension de la reaccion en una direccion. En forma semejante, el mnimo valor de para el cual
todos los n
umeros molares son no negativos define la maxima extension de la reaccion en la direccion
inversa. El valor de en equilibrio debe estar entre estos dos valores. Se define entonces el grado
de reacci
on como
=

min
max min

(293)

Es posible que una solucion de la ecuacion (290) nos arroje un valor de mayor que max ( > 1)
o menor que min ( < 0). En ese caso la reaccion se termina cuando una de las componentes se
agota. El valor de equilibrio para sera entonces max
o min ; G no alcanzara su mnimo, pero
tomara el menor valor posible accesible al sistema.
De la relacion H = G + T S, tenemos a temperatura constante que dH = dG + T dS y por lo
tanto

Usando

=A+T
P,T

P,T

Termodinamica y Mecanica Estadstica I - Notas 2010

S=

G
T

85

P,

tenemos en equilibrio

=T
P,T

0
P,T

"

= T
T

#0

= T
P,T P,

A
T

(294)
P,

El lado izquierdo de esta ecuacion se conoce como calor de reacci


on; el mismo representa la
cantidad de calor absorvido por unidad de reaccion en la vecindad del equilibrio. Si esta cantidad
es positiva, la reaccion se dice endotermica; si es negativa exotermica.

9.3.

Energa libre de Gibbs y potenciales qumicos para una mezcla de gases

Veamos ahora la energa libre de Gibbs para una mezcla de gases ideales a partir de la expresion
para la entropa Ec.(147), esto es

S=

X
j

Nj s0 +

cj Nj R ln

X
V
T
+ N R ln
RN
xj ln xj
T0
N v0
j

donde xj = Nj /N son las fracciones molares. A partir de la ecuacion de estado P V =


N R T podemos expresar el vol
umen en funcion de T y P
V = N R T /P

(295)
P
j

Nj RT =

(296)

la cual reemplazada en la Ec.(295) nos da S en funcion de T , P y los n


umeros de moles. La energa
P
interna, por otra parte, viene dada por U = j Uj (T, Nj ). Reemplazando estas expresiones en
G(T, P, N1 , . . . , Nr ) = U T S + P V
obtenemos (la derivacion es dejada como ejercicio)
G(T, P, N1 , . . . , Nr ) =

Gj (T, P, Nj ) + N R T

xj ln xj

(297)

donde Gj es la energa libre de Gibbs para la componente j aislada a temperatura y presion T y P


P
respectivamente y N R T j xj ln xj es el termino de mezcla (derivado de la entropa de mezcla).
P
Dado que G = j j Nj , resulta inmediato que
(0)

j (T, P, xj ) = j (T, P ) + R T ln xj

(298)

(0)

donde j (T, P ) = Gj /Nj es el potencial qumico de la componente j aislada. Para una mezcla de
gases ideales, el potencial qumico de la componente j depende de los n
umeros molares a traves de
la fracion molar xj exclusivamente.
Para una mezcla de gases reales debilmente interactuantes, podemos asumir que la energa libre
de Gibbs tomara la forma (297) mas un termino de interacci
on Gint (T, P, N1 , . . . , Nr ), dependiente
de la mezcla particular. Un modelo fenomenologico simple viene dado por:
Gint (T, P, N1 , . . . , Nr ) =

X Ni Nj
i6=j

con > 0. Utilizaremos este modelo mas adelante en diversas aplicaciones.

(299)

Termodinamica y Mecanica Estadstica I - Notas 2010

86

Figura 16: La membrana semipermeable soporta la presion osmotica = s g h de la columna de


altura h de una solucion de agua con azucar.

9.4.

Presi
on Osm
otica

El fenomeno de osmosis se presenta con frecuencia en la naturaleza, especialmente en sistemas


biologicos. El mismo puede ser ilustrado mediante un experimento simple. Tomemos un recipiente
con agua abierto; introduzcamos un tubo abierto en el extremo superior y cerrado en el inferior
por una membrana permeable al agua, pero impermeable al azucar, como se ilustra en la Fig.16.
Evidentemente el nivel de agua dentro del tubo sera igual al nivel fuera del mismo. Ahora introduzcamos azucar por el extremo superior del tubo, dejando que se forme dentro del mismo una
solucion de agua azucarada. Veremos que el nivel de agua dentro del tubo sube hasta una altura
h por encima del nivel fuera del tubo. El exceso de presion = s h g (donde s es la densidad
de la solucion y g es la aceleracion de la gravedad) se conoce como presi
on osm
otica. Una vez
alcanzado el equilibrio, la presion del lado de la membrana en contacto con la solucion es mayor a
la presion en el lado en contacto con el agua en una cantidad . La membrana debe sostener este
desbalance de fuerzas.
Para analizar las condiciones de equilibrio podemos simplificar el problema y considerar dos
recipientes en ausencia de gravedad separados por una membrana rgida semipermeable y todo el
conjunto a temperatura T . En uno de los recipientes tenemos agua pura y en el otro la solucion
azucarada. En equilibrio, habra un desbalance de presiones a ambos lados de la membrana; si
la presion en la camara con agua pura es P0 la presion en la camara con la solucion azucarada
sera P0 + . Este desbalance de presiones es posible porque la membrana es rgida y no puede
transmitir energa mecanica. Por otra parte, el agua puede fluir libremente a traves de la membrana.
De acuerdo con la Ec.(298) el potencial qumico del agua en la solucion es inferior al potencial
qumico del agua pura, ya que la fraccion molar del agua es inferior a uno. Si bien la Ec.(298)
fue derivada para una mezcla de gases ideales, puede verse que en general el potencial qumico es
una funcion creciente de la fraccion molar. De esta manera, el agua fluye hacia la solucion para
aumentar la fraccion molar del agua en la misma (o disminuir la concentraci
on de azucar), a fin de
equilibrar los potenciales qumicos. En equilibrio, el potencial qumico del agua en ambas camaras
debe ser igual.
Sean Nw y Ns los n
umeros molares del agua y el azucar. Dado que los potenciales qumicos

Termodinamica y Mecanica Estadstica I - Notas 2010

87

son magnitudes intensivas, los mismos dependen de los n


umeros molares a traves de las fracciones
molares, o equivalentemente de la concentraci
on Ns /Nw , ya que
xw =

Nw
1
=
Nw + Ns
1 + Ns /Nw

xs =

Ns
Ns /Nw
=
Nw + Ns
1 + Ns /Nw

Dado que xw + xs = 1, tenemos entonces un u


nico parametro independiente, que vamos a elegir
xs . Si 0w (T, P ) es el potencial qumico del agua pura, la condicion de equilibrio es entonces:
0w (T, P0 ) = w (T, P, xs )

(300)

donde P = P0 +. Dado que estamos expresando el problema en terminos de T y P , la representaci


on
adecuada es la de Gibbs. Para estimar los potenciales qumicos, vamos a considerar el modelo para
una mezcla de fluidos interactuantes dado por la ecuaciones (297) y (299), esto es,
G(T, P, Nw , Ns ) = Nw 0w (T, P ) + Ns 0s (T, P ) + Nw R T ln xw + Ns R T ln xs

Nw Ns
N

(301)

El potencial qumico del agua en la solucion viene dado por

w (T, P, xs ) =

G
Nw

P,T,Ns

= 0w (T, P ) x2s + R T ln(1 xs )

(302)

donde hemos usado xw = 1 xs . La condicion de equilibrio viene entonces dada por


0w (T, P0 ) = 0w (T, P0 + ) x2s + R T ln(1 xs )

(303)

Esto nos da una ecuacion para la presion osmotica en funcion de T y la concentraci


on de
0
0
soluto xs . Dado que w (T, P ) = Gw (T, P, Nw )/Nw tenemos que

0w
P

!
T

1
=
Nw

G0w
P

=
T,Nw

Vw0
0
= vw
(T, P )
Nw

0 (T, P ) es el vol
donde vw
umen molar del agua en ausencia de azucar. Ahora bien, el agua al igual
que la mayora de los lquidos es sumamente incompresible. La compresibilidad del agua a 0o C es
T = 4,67 105 1/atm. El vol
umen molar por lo tanto permanece aproximadamente constante
para cambios no muy grandes en la presion. Podemos por lo tanto integrar la ecuacion anterior y
obtener
0
0w (T, P0 + ) 0w (T, P0 ) = vw

(304)

A fin de obtener una expresion de la presion osmotica en terminos de magnitudes medibles,


vamos a simplificar a
un mas la situacion considerando un solucion muy diluida, esto es Ns /Nw 1
y por lo tanto xs Ns /Nw 1. En estas cirscunstancias, el vol
umen del agua pura sera aproxi0
0
madamente igual a vol
umen de la mezcla: Vw = Nw vw V . Ademas, dado que xs 1 podemos
desarrollar ln(1 xs ) = xs x2s /2 . A primer orden en xs tenemos por lo tanto de la Ec.(303)
Ns R T
(305)
V
La ecuacion (305) se conoce como ley de vant Hoff y luce muy similar a la ecuacion de estado
de un gas ideal. Esto no es casualidad, ya que al considerar un gas muy diluido hemos despreciado
el termino de interaccion entre moleculas del soluto y el solvente. En esta situacion, vemos que la
presion osmotica es fundamentalemente un efecto entr
opico (derivado de la entropa de mezcla),
si bien para concentraciones mayores la interacci
on sera tambien importante. Como ejemplo final,

Termodinamica y Mecanica Estadstica I - Notas 2010

88

consideremos la prediccion de la ley de vant Hoff para una solucion de Ns = 0,1 moles de azucar
en un Kg de agua. El peso molecular del agua es 18 gr/mol, lo cual nos da 55.56 moles de agua en
1 Kg. Reemplazando en la Ec.(305) obtenemos
=

0,1 (8,317 J/K)(303 K)


= 2,53 105 Pa 2,5 atm
103 m3

a temperatura ambiente (el valor medido es = 2,52 105 Pa).

Termodinamica y Mecanica Estadstica I - Notas 2010

10.

89

Estabilidad de los sistemas termodin


amicos

El segundo postulado de la termodinamica establece que, en equilibrio, dS = 0 y d2 S < 0


ante variaciones de vnculos internos a energa total constante; la primera de estas condiciones nos
dice que la entropa es un extremo, mientras que la segunda nos dice que dicho extremo es un
maximo. Hasta aqui no hemos analizado las consecuencias de esta segunda condicion. Vamos a
ver en este captulo como la misma plantea limitaciones muy precisas acerca de la forma posible
de toda relacion fundamental. Dichas limitaciones estan asociadas con el concepto de estabilidad
termodin
amica, del cual veremos se derivan algunas de las predicciones mas interesantes de la
teora.

10.1.

Estabilidad y segundo postulado

Consideremos dos subsistemas identicos en equilibrio, cada uno con una relacion fundamental
S = S(U, V, N ), separados por una pared completamente restrictiva, la cual vamos a tornar luego
diatermica, pero manteniendola impermeable y fija. De esta manera, podemos concentrarnos ex(i)
clusivamente en la energa de los subsistemas. La entropa del sistema total es St = 2 S(U ) y la
energa total es 2 U . Siendo que los subsistemas son identicos, la ausencia de la pared no debera
cambiar nada, ya que los parametros intensivos de ambos subsistemas adoptan los mismos valores.

Figura 17: En una relacion fundamental convexa, la entropa puede ser aumentada transfiriendo
energa entre subsistemas; tal sistema es inestable termodinamicamente.
Supongamos ahora que la relacion fundamental S = S(U, V, N ) tiene la forma que se muestra
en la Fig. 17. Supongamos tambien que producimos un cambio virtual en el sistema, transfiriendo
una cantidad de energa U de un subsistema a otro (la energa total por lo tanto no cambia). La
(i)
(f )
entropa total va a cambiar de St = 2 S(U ) a St = S(U + U ) + S(U U ). Si la relacion
fundamental tiene la forma que se muestra en la Fig.17 (esto es, una curva convexa en el intervalo
(f )
(i)
de interes), resulta claro que St > St = 2 S(U )! Si el vnculo adiabatico se remueve de la pared,
habra un flujo de energa de un susbsistema a otro hasta que se alcance el maximo valor posible
de la entropa total; as, la temperatura aumentar
a en un susbsistema y disminuir
a en el otro.
Pero esto esta en contradiccion con la suposicion inicial de que el sistema estaba en equilibrio (los

Termodinamica y Mecanica Estadstica I - Notas 2010

90

subsistemas son identicos). Mas a


un, dentro de un subsistema resultara ventajoso transferir energa
de una region a otra del subsistema, desarrolando inhomogeneidades. Esta perdida de homogeneidad
es la marca de una transicion de fase. Una relacion fundamental convexa en la energa (esto es,
cuya curva yace por debajo de la cuerda entre cualquier par de puntos en el intervalo de interes)
implica que el sistema es inestable termodin
amicamente y por lo tanto no describe estados de
equilibrio. La condicion de estabilidad es por lo tanto la concavidad global de la entropa:
S(U + U ) + S(U U ) 2 S(U )

(306)

la cual debe cumplirse para todo valor de U . En el lmite U 0 esta condicion se reduce a la
forma diferencial

2S
U 2

(307)

V,N

Es claro que la validez de la condicion (307) en un punto no implica la condicion (306); en este
caso decimos que el sistema en dicho punto es localmente estable. Geometricamente, la condicion
(307) implica que la recta tangente a la curva en el punto yace por encima de la curva para un
entorno del punto en cuestion. La condicion de estabilidad global (306), por otra parte, implica que
la recta tangente a la curva en el punto yace por encima de la curva completa.
Es evidente que las mismas consideraciones se aplican al caso de transferencia de vol
umen:
S(U, V + V ) + S(U, V V ) 2 S(U, V )

(308)

o, en su forma diferencial

2S
V 2

(309)

U,N

y en forma general este tipo de relacion debe cumplirse para cualquier parametro extensivo.
Una relacion fundamental que no satisfaga las condiciones de estabilidad puede resultar de la
extrapolacion de resultados experimentales o de un modelo de la mecanica estadistica. Como se
interpreta esto? Supongamos una relacion fundamental como se muestra en la Fig.18. La region
entre los puntos C y E (puntos de inflexion donde la derivada segunda cambia de signo) es inestable,
ya que alli la entropa es convexa (no se satisface ni siquiera la condicion de estabilidad local). Las
regiones entre los pares de puntos A-C y E-G son al menos localmente estables, ya que en todo
punto de dichas regiones la derivada segunda es negativa. Sin embargo, existe una diferencia entre
laa regiones comprendidas entre los pares de puntos A-B y F-G y las regiones entre los pares
de puntos B-C y E-F. Para cualquier punto en las primeras regiones la tangente al mismo yace
por encima de toda la curva completa y por lo tanto en dichas regiones el sistema es globalmente
estable; estas regiones de la relacion fundamental describen adecuadamente estados de equilibrio.
Para cualquier punto en las segundas regiones la tangente al mismo corta la curva en alg
un punto y
por lo tanto dichas regiones son solo localmente estables y no corresponden a estados de equilibrio.
Una relacion fundamental globalmente estable puede obtenerse a partir de la anterior (llamada
relacion fundamental subyacente) mediante la construccion que se muestra en la Fig.18. Primero se
trazan todas las rectas tangentes a la curva que yacen por encima de la curva completa; la relaci
on
fundamental termodin
amica se toma entonces como la envolvente de dicha familia de rectas. En
el ejemplo de la Fig.18 la porcion BCDEF de la curva se reemplaza por el segmento de recta
BHF. Dicha curva satisface el criterio de estabilidad global. Un punto sobre el segmento BHF
representa un sistema heterogeneo, compuesto por dos subsistemas (fases) cada uno en los estados
B y F respectivamente. Para cualquier valor del parametro Xj en el intervalo correspondiente a los
estados entre B y F un estado heterogeneo con las caractersticas anteriores tiene mayor entropa que

Termodinamica y Mecanica Estadstica I - Notas 2010

91

aquella dada por la relacion fundamental subyacente. Tenemos entonces que el estado de equilibrio
corresponde a una coexistencia de fases. Desarrollaremos en detalle este fenomeno en el captulo
siguiente.

Figura 18: La relacion fundamental subyacente ABCDEFG es inestable (no satisface la condicion
de concavidad global en la porcion BCDEF). La relacion fundamental estable es la correspondiente
a ABHFG. Puntos a lo largo de la lnea BHF corresponden a una combinaci
on inhomogenea de dos
subsistemas en los estados B y F respectivamente.
En el espacio tridimensional S-U-V, la condicion de estabilidad global requiere que la superficie
entropa S(U, V ) este por debajo de cualquiera de sus planos tangentes. Esto es, para valores
arbitrarios de U y V :
S(U + U, V + V ) + S(U U, V V ) 2 S(U, V )

(310)

de la cual se reobtienen las condiciones diferenciales (307) y (309), as como la condicion adicional
2S 2S

U 2 V 2

2S
U V

!2

(311)

La condicion S 2 /U 2 nos asegura que la curva que resulta de la intersecci


on de la superficie
entropa con un plano a V = cte tiene curvatura negativa (concava) en el punto en cuestion. La
condicion S 2 /V 2 nos asegura que la curva que resulta de la intersecci
on de la superficie entropa
con un plano a U = cte tiene curvatura negativa tambien. Ambas condiciones no son suficientes
para asegurar la concavidad de la superficie en el punto. Podra ocurrir que exista un cambio
de curvatura (convexidad) en las direcciones diagonales U, V (tipo canaletas). La condicion
diferencial (311) impide esto u
ltimo. Fsicamente esta condicion asegura que inhomogeneidades
conjuntas en U y V no incrementan la entropa.
Notemos que

Termodinamica y Mecanica Estadstica I - Notas 2010

2S
U 2

=
V,N

1
1
= 2
U T
T

T
U

92

=
V,N

1
T2 N

cv

(312)

As, la condicion de estabilidad tiene como consecuencia directa que el calor especfico a vol
umen
constante no puede ser nunca negativo en un sistema estable. Veremos mas adelante otras consecuencias semejantes de los criterios de estabilidad.
Finalmente, en un espacio termodinamico de r + 2 dimensiones (S, X0 , X1 , . . . , Xr ) la condicion
de estabilidad global es que la hipersuperfice entropa se encuentre enteramente debajo de su familia
de hiperplanos tangentes.

10.2.

Condiciones de estabilidad para los potenciales termodin


amicos

Tal como ocurre con el resto de las propiedades termodinamicas, los criterios de estabilidad
tienen su reformulacion en la representaci
on energa, la cual es casi trivialmente una transcripcion
de lenguaje. Cuando la entropa es un maximo, la energa es un mnimo; si la condicion de estabilidad
es la concavidad global de la superficie entropa, esta equivale a la convexidad global de la superficie
energa. Esto es, la superficie energa en el espacio (U, S, V ) esta siempre por encima de su familia
de planos tangentes:
U (S + S, V + V ) + U (S S, V V ) 2 U (S, V )

(313)

para valores arbitrarios de U y V . Las condiciones de estabilidad local resultan:


2U
S 2
2U
V 2

T
0
S
P
=
0
V
=

y para variaciones conjuntas de S y V


2U 2U

S 2 V 2

2U
S V

!2

(314)

(notemos que la primera de estas desigualdades implica que la entropa es siempre una funcion
monotona creciante de la temperatura).
Estos resultados pueden extenderse facilmente a cualquiera de las transformadas de Legendre de
la energa (o tambien de la entropa). Para ver esto recordemos que, si X es un parametro extensivo
y
P =

U
X

entonces
U [P ] = U P X
y
X(P ) =

U [P ]
P

As
2 U [P ]
X
1
1
=
= P = 2 U
2
P
P
2
X
X

Termodinamica y Mecanica Estadstica I - Notas 2010

93

Vemos que el signo de 2 U [P ]/P 2 es opuesto al signo de 2 U/X 2 . Por lo tanto, si U es una
funcion convexa de X, U [P ] es una funcion concava de P . Se sigue entonces que el potencial de
Helmholtz es una funcion concava de la temperatura y convexa del vol
umen

2F
T 2

0
V,N

2F
V 2

0,

(315)

T,N

la entalpa es una funcion concava de la presion y convexa de la entropa

2H
P 2

0
S,N

2H
S 2

(316)

P,N

y el potencial de Gibbs es una funcion concava tanto de la temperatura como de la presion

2G
T 2

0
P,N

2G
P 2

0,

(317)

T,N

Resumiendo, para N constante los potenciales termodinamicos (esto es, la energa y sus transformadas de Legendre) son funciones convexas de sus variables extensivas y concavas de sus variables
intensivas. La relacion inversa se cumple para las funciones de massieu.

10.3.

Consecuencas fsicas de la estabilidad termodin


amica

Hemos visto ya como la estabilidad termodinamica implica que el calor especfico a vol
umen constante no puede ser negativo. En forma general, las condiciones de estabilidad imponen limitaciones
para la mayora de las funciones respuesta, ya que todas ellas estan relacionadas con derivadas segundas de la relacion fundamental. Por ejemplo, la convexidad del potencial de Helmholtz respecto
del vol
umen nos da la restriccion

2F
V 2

P
=
V

T,N

=
T,N

1
0,
V T

es decir,
T 0

(318)

Por otra parte, de la concavidad de la entalpa respecto de la presion tenemos que

2H
P 2

=
S,N

V
P

S,N

= V s 0,

(319)

es decir,
s 0
Si recordamos las relaciones (obtenidas de las relaciones de Maxwell)
cp = cv +

T v 2
T

y
s
cv
= ,
T
cp
el hecho de que tanto cv como T sean positivos implica a su vez que

(320)

Termodinamica y Mecanica Estadstica I - Notas 2010

cp cv 0
T

s 0

94

(321)
(322)

As, en un sistema estable, tanto las compresibilidades como los calores especficos deben ser
positivos. La adicion de calor, ya sea a presion o a vol
umen constante, necesariamente incrementa
la temperatura de un sistema estable, siendo dicho incremento mayor en un sistema mantenido a
vol
umen constante que en uno mantenido a presion constante. Un decremento del vol
umen, ya sea
isotermico o isoentropico, necesariamente incrementa la presion de un sistema estable, siendo dicho
incremento mayor en un proceso isoentr
opico que en uno isotermico.

10.4.

El principio de Le Chatelier

El contenido fsico de los criterios de estabilidad puede resumirse en lo que se conoce como el
Principio de Le Chatelier. De acuerdo con el mismo, el criterio de estabilidad es tal que cualquier
inhomogeneidad que se genere de alguna manera en el sistema tiene que inducir una respuesta en el
mismo que tiende a erradicar la inhomogeneidad. Esto es valido en general para cualquier sistema
estable. Cualquier perturbacion externa tiene que inducir una fuerza restitutivaque contrareste
la perturbacion (podemos pensar en un feedback negativo). La idea es casi obvia: si no existiera tal
tipo de tendencia cualquier perturbacion podria crecer indefinidamente y por lo tanto el estado no
sera estable.
Tomemos un ejemplo. Supongamos un fluido en equilibrio y un foton que incide en el mismo,
siendo absorbido en alg
un punto del fluido generando un aumento local de la temperatura. Tendremos entonces un flujo de calor desde la region mas caliente a la mas fra, el cual en virtud del
criterio de estabilidad (positividad de los calores especficos) va a tender a disminuir la temperatura
local. En forma semejante, una onda de vibracion longitudinal en un fluido crea regiones de alta
y baja densidad alternadas. La positividad de la compresibilidad nos dice que la presion aumentara en las regiones de alta densidad y disminuir
a en las de baja densidad, de tal manera que estas
respuestas van a tender a restaurar la homogeneidad del sistema.
De hecho, inhomogeneidades ocurren todo el tiempo en todos los sistemas, a
un en ausencia de
perturbaciones externas. En un gas, por ejemplo, las moleculas se mueven en todas las direcciones al
azar, creando aleatoriamente regiones de alta y baja densidad. Desde la perspectiva de la mecanica
estadstica todos los sistemas sufren fluctuaciones locales aleatorias permanentemente en todas sus
variables de estado: es solo el promedio temporal de dichas variables lo que permanece estatico y
el valor de dicho promedio es lo que se refleja en la descripcion termodinamica. Inhomogeneidades
locales se generan contnua y espontaneamente para ser inmediatamente atenuadas y dispadas de
acerdo con el principio de Le Chatelier.

10.5.

El principio de Le Chatelier-Braun

El principio de Le Chatelier se generaliza a un principio mas profundo conocido como Principio


de Le Chatelier-Braun.
Supongamos que un sistema es sacado (levemente) del equilibrio por alguna accion externa o por
una fluctuacion. De acuerdo con el principio de Le Chatelier la perturbacion induce directamente un
proceso (una cierta reaccion) que aten
ua la perturbacion, restaurando el equilibrio. Pero este no
es el u
nico efecto de la perturbacion externa. Varios otros procesos se generan indirectamente por
causa de la misma. El Principio de Le Chatelier-Braun nos dice que todos esos procesos inducidos
indirectamenre tambien act
uan de tal manera de reducir la perturbacion.
Veamos un ejemplo. Supongamos un gas contenido en un cilindro con paredes diatermicas y
un piston libre, todo esto inmerso en un ba
no, esto es, un reservorio de temperatura y presion

Termodinamica y Mecanica Estadstica I - Notas 2010

95

(ej., la atmosfera). El sistema se encuentra en equilibrio con su entorno y supongamos ahora que
el piston se desplaza ligeramente hacia afuera, ya sea por efecto de un agente externo o por una
fluctuacion espontanea. El efecto directo es que la presion interna en el cilindro disminuye (ya que
la compresibilidad es positiva), con lo cual la diferencia de presiones con el ba
no tiende a empujar
el cilindro hacia adentro restaurando el vol
umen original. Este es el principio de Le Chatelier. Un
efecto secundario es que la dilatacion dV altera la temperatura del cilindro. Si el cambio de vol
umen
es peque
no (infinitesimal) y rapido, podemos aproximar

dT =

T
V

dV =
S

T
dV
N cv T

Este cambio de temperatura puede tener en principio cualquier signo, ya que no existen restricciones para el signo de (los criterios de estabilidad solo imponen un signo definido para las
derivadas segundas de una relacion fundamental respecto a una misma variable); para la mayora
de los sistemas > 0, no obstante todos conocemos un ejemplo celebre de una sustancia para la
cual puede ser negativo: el agua! Tenemos entonces que habra un flujo de calor hacia adentro si
> 0 y haca afuera si < 0, esto es
signo(d0 Q) = signo()
Este flujo de calor, por su parte, va a producir un cambio en la presion del sistema:
1
dP =
T

P
S

d0 Q =
V

d0 Q
N T 2 cv T

De manera que la presion se incrementa (dP > 0), cualquiera sea el signo de . Por lo tanto el
efecto secundario, esto es el flujo de calor, act
ua tambien de manera de disminuir la perturbacion
inicial. Este es el principio de Le Chatelier-Braun.
Para demostrar formalmente tanto el principio de Le Chatelier como el de Le Chatelier-Braun
consideremos un sistema en contacto con un reservorio de dos variables intensivas P1 y P2 (ej.,
presion y temperatura o temperatura y potencial qumico de una componente, etc) cada una conjugada a una variable extensiva X1 y X2 respectivamente. Supongamos ahora que se produce una
fluctuacion espontanea en la variable X1 X1 + dX1f (el suprandice f corresponde a fluctuacion).
Esta fluctuacion vendra acompa
nada de un cambio en el parametro conjugado P1 :
dP1f =

P1
dX1f
X1

pero tambien producira un cambio en el parametro intensivo P2


dP2f =

P2
dX1f
X1

Nos preguntamos ahora acerca de los cambios que induciran los cambios dP1f y dP2f en las
variables X1 y X2 . Vamos a designar el cambio inducido en la variable Xj como dXjr (el suprandice
r indica respuesta). Dado que la fluctuacion saca al sistema del equilibrio, la respuesta tiene que
ser tal que disminuya la energa total del sistema mas el ba
no (conjunto de reservorios):
d(U + U b ) = (P1 P1b ) dX1r + (P2 P2b ) dX2r
= dP1f dX1r + dP2f dX2r 0
Dado que X1 y X2 son independientes, tenemos entonces que

(323)

Termodinamica y Mecanica Estadstica I - Notas 2010

96

dP1f dX1r 0

(324)

dP2f

(325)

dX2r

Analizaremos estas desigualdades por separado. Si multiplicamos aa Ec.(324) por P1 /X1 , el


cual es positivo por el criterio de convexidad, obtenemos
dP1f .

P1
r(1)
dX1r = dP1f dP1
0
X1
r(1)

en el parametro intensivo conjugado P1 que


Esto es, la respuesta dX1r produce una cambio dP1
f
es opuesto en signo al cambio dP1 inducido por la fluctuacion original. Este es la expresion del
principio de Le Chatelier.
La segunda desigualdad Ec.(325) puede ser escrita como
P2
dX1f dX2r 0
X1
que, usando la relacion de Maxwell
P2
P1
=
X1
X2
y multiplicando por la cantidad positiva P1 /X1 nos da

P1
P1
dX1f .
dX2r
X1
X2

o
r(2)

dP1f dP1

r(2)

Esto es, la respuesta dX2r produce una cambio dP1 en el parametro intensivo P1 que es opuesto
en signo al cambio dP1f inducido por la fluctuacion original. Este es la expresion del principio de
Le Chatelier-Braun.
Finalmente, notemos que multiplicando la Ec.(325) por la cantidad positiva P2 /X2 obtenemos
r(2)

dP2f dP2

r(2)

Esto es, la respuesta dX2r produce una cambio dP2 en su parametro intensivo conjugado P2 que
es opuesto en signo al cambio dP2f inducido por la fluctuacion en X1 .

Termodinamica y Mecanica Estadstica I - Notas 2010

11.
11.1.

97

Estabilidad y Transiciones de fase de primer orden


Transiciones de primer orden: fenomenologa, definiciones y propiedades
generales

El agua es lquida a temperatura ambiente y presion atmosferica, pero si se la enfra hasta los
273.15 K, manteniendo la presion constante, solidifica en hielo; si se la calienta hasta los 373.15 K
se transforma en vapor. En cada una de estas temperaturas el material sufre un cambio abrupto
en sus propiedades termodinamicas (por ejemplo, en la densidad). Fen
omenos de esta naturaleza
ocurren practicamente en todos los materiales en diferentes circunstancIas y se conocen como
transiciones de fase. Los diferentes estados entre los cuales transiciona el material se denominan
fases termodin
amicas. Las mismas transiciones de fase pueden observarse variando la presion a
temperatura constante. Existen muchos otros tipos de transicion de fase, no solo la solidificacion
o la vaporizacion. Por ejemplo, a altas presiones y/o bajas temperaturas el hielo sufre diversas otras
transiciones entre diferentes fases solidas, caracterizadas por diferentes estructuras cristalinas (el
hielo presenta nueve fases solidas cristalinas).
En el caso del agua lquida (o un fluido generico) el punto de transicion (supongamos lquidovapor) representa un punto en el diagrama (P, T ). Si modificamos la presion veremos que la temperatura de transicion cambia, definiendo una lnea de transicion P = P (T ), la cual separa la fase
lquida de la gaseosa. Tenemos una curva semejante para la transicion solido-lquido y, en general
una lnea por cada transicion diferente. Para un sistema con mas grados de libertad podremos
tener superficies que separan diferentes fases. El conjunto de hipersuperficies en el espacio de configuraciones termodinamicas o alguno de sus cortes definen lo que se conoce como diagramas de
fases.
Volvamos a la transicion lquido-vapor. Supongamos que entregamos calor a presion constante a
una cierta cantidad de lquido, hasta que el mismo alcanza la temperatura de transicion. Si continuamos entregando calor, una cierta fraccion del lquido se transformara en vapor, sin aumentar la
temperatura, esto es, todo el calor entregado se utiliza en transformar el lquido en vapor. La cantidad de calor necesaria para tranformar un mol de la sustancia ntegramente en vapor se conoce
como calor latente de vaporizaci
on. Una vez que tranformamos todo el lquido en vapor, si
continuamos entregando calor aumentaremos la temperatura del sistema, ahora todo vapor. Pero
si en la mitad del proceso interrumpimos la entrega de calor y mantenemos la temperatura y la
presion constantes, se observa que las proporciones de lquido y vapor se mantienen constantes
indefinidamente. Esto es, en el punto de transicion coexisten en equilibrio termodin
amico el
lquido y el vapor. Las interacciones microscopicas son tales que en dichas condiciones un estado
homogeneo de la sustancia se vuelve inestable termodinamicamente y el estado de equilibrio se
vuelve heterogeneo. Lo mismo vale para la transicion solido-lquido (fusion o solidificacion, seg
un
la direccion) o la solido-gas (sublimacion). Existe una enorme variedad de transiciones de fase en
las cuales dos o mas fases coexisten en equilibrio; mas a
un, existen otros tipos de transicion sin
coexistencia de fases (veremos ejemplos de esto mas adelante).
Que es lo que caracteriza entonces estas transiciones en las cuales pueden coexistir dos o mas
fases en equilibrio? Mas a
un, como se define una transicion de fase? O incluso, a que estamos
llamando fase? Veamos las respuestas a estas preguntas en orden inverso.
Estamos llamando fases a dos estados termodinamicos diferentes que pueden existir (o coexistir)
para los mismos valores de un cierto conjunto de parametros intensivos, por ejemplo, para la
misma temperatura y presion. Pensemos de nuevo en la transicion lquido-gas en el punto de
transicion. Que diferencia ambas fases, es decir, el lquido del vapor? Principalmente su densidad,
o equivalentemente, su vol
umen molar. El lquido tiene un vol
umen molar mucho menor que el gas.
De esta manera, el vol
umen molar sufre un cambio abrupto (discontinuo) en la transicion. Esta no
es la u
nica cantidad que cambia de manera discontnua. El hecho de que exista un calor latente de
vaporizacion lv nos dice que la entropa tambien sufre un cambio discontnuo al transformar una

Termodinamica y Mecanica Estadstica I - Notas 2010

98

cierta cantidad de lquido en vapor, ya que la transicion ocurre a temperatura constante. Esto es,
s = svapor sliq = lv /Tt , donde Tt es la temperatura de la transicion a la presion dada. Dado
que lv > 0 (es necesario entregar calor para vaporizar el lquido) tenemos que svapor > sliq ; esto
esta de acuerdo con el segundo postulado (estabilidad termodinamica): la entropa tiene que ser
una funcion monotona creciente de la temperatura ya que (s/T )P = ( 2 g/T 2 )P 0. Las
mismas consideraciones valen para la transicion solido-lquido, con algunas peque
nas diferencias.
En primer lugar, el vol
umen molar del solido no necesariamente es menor que el del lquido (aunque
sigue existiendo una discontinuidad). El ejemplo tpico de esto nuevamente es el agua, ya que el
hielo a 0o C tiene mayor vol
umen molar que el agua lquida a igual temperatura, gracias a lo cual
flota (y gracias a lo cual existen seres vivos en la tierra que pueden estudiar la termodinamica de
las transiciones de fase!). El cambio de entropa, por otro lado, es siempre positivo al pasar del
solido al lquido (esto es, el calor de fusion es siempre positivo), ya que de otro modo se violara
el segundo postulado. No obstante, existe una gran diferencia con la transicion de vaporizacion.
Mientras que en este u
ltimo caso el aumento de entropa se debe exclusivamente al aumento de
vol
umen, en el caso de la fusion se debe fundamentalmente a un cambio de simetra. Las moleculas
en un lquido pueden ocupar cualquier posicion con igual probabilidad y por lo tanto el sistema es
invariante ante traslaciones, mientras que en un solido las moleculas se ordenan en una estructura
cristalina, con lo cual el mismo pierde la simetra de traslacion continua. Esta perdida de simetra
produce una reduccion drastica en la entropa al solidificar. El analisis de los cambios de simetra
se encuentra en la base de la teora de las transiciones de fase, pero excede el presente curso.
Tenemos entonces que el vol
umen y la entropa sufren cambios discontnuos en este tipo de
transiciones. Ahora bien, tanto el vol
umen como la entropa son proporcionales a derivadas primeras
del potencial Gibbs, con respecto a la temperatura y la presion respectivamente. Se define entonces
una transici
on de fase de primer orden como aquella en la cual una o mas de las derivadas
primeras de un potencial termodinamico son discontnuas.
La denominacion anterior es de orgen historico y se debe a una clasificacion de las transiciones
de fase debida a Ehrenfest, en la cual se supona que toda transicion de fase deba estar asociada a
discontinuidades en las derivadas de alg
un orden. Hoy sabemos que dicha clasificacion es incompleta
e incluso en algunos casos incorrecta ya que, si bien existen algunas transiciones en las cuales
derivadas de orden superior son discontnuas, eso no describe completamente el fenomeno. Incluso
se conocen ahora un conjunto muy amplio de transiciones (mal llamadas tambien de 2do orden) en
las cuales no hay ninguna discontinudad en ninguna derivada y en cambio algunas de estas resultan
divergentes. De todas maneras, estas denominaciones se han mantenido por el uso de la costumbre.
En una perspectiva mucho mas moderna, se define en terminos generales una transicion de fase
como un punto (o una region) en el espacio de configuraciones termodinamicas de no analiticidad
de la relaci
on fundamental.
Una comprension acabada de las transiciones de fase en general requiere de un analisis de las
propiedades microscopicas de los sistemas y por lo tanto cae fuera del alcance de la termodinamica.
No obstante, al menos las transiciones de primer orden pueden interpretarse en general como una
perdida de estabilidad en una relacion fundamental subyacente. De esta manera, la coexistencia de
fases resulta asociada a la region lineal de la relacion fundamental termodinamica que restaura la
estabilidad global, tal como vimos en el captulo anterior.

11.2.

Coexistencia de fases: regla de las fases de Gibbs

El hecho de que diferentes fases coexistan en equilibrio nos permite deducir varias de las
propiedades generales de las transiciones de primer orden, simplemente a partir de la aplicacion de
las condiciones de equilibrio termodinamico. Esto es, podemos pensar cada una de las fases como
subsistemas separados por paredes no restrictivas y aplicar el formalismo previo.
Una primera pregunta a plantearse es: Cuantas fases pueden coexistir para un dado sistema?
Veremos que los postulados de la termodinamica imponen restricciones acerca del n
umero maximo

Termodinamica y Mecanica Estadstica I - Notas 2010

99

de fases que pueden coexistir en equilibrio.


Tomemos por ejemplo un sistema simple monocomponente, el cual posee solo dos grados de
libertad termodinamicos. Las fases que coexisten en un sistema de este tipo estan en equilibrio
termico y mecanico (iguales temperaturas y presiones1 ) y pueden intercambiar materia. Bajo estas
condiciones ambas fases tendran que tener iguales potenciales qumicos. Para un sistema simple
tenemos que = (P, T ) y si tenemos dos fases I y II entonces
I (P, T ) = II (P, T )
Esta ecuacion nos da una relacion P = P (T ) que define una curva en el diagrama de fases, a lo
largo de la cual las fases I y II pueden coexistir en equilibrio. Si tenemos tres fases I, II, y III
coexistiendo, las mismas tienen que satisfacer
I (P, T ) = II (P, T ) = III (P, T )
Dado que tenemos dos ecuaciones en las incognitas P y T , la solucion, si existe, es u
nica. Por lo tanto
tres fases diferentes de un sistema simple solo pueden coexistir en un punto aislado del diagrama
de fases. Esto se conoce como punto triple. Para un sistema simple, cuatro fases diferentes no
pueden coexistir en equilibrio, ya que tendramos que satisfacer tres ecuaciones para los distintos
potenciales qumicos con solo dos incognitas.
Supongamos ahora que tenemos una mezcla de dos componentes qumicas a temperatura y
presion constantes. Supongamos ademas que el sistema puede presentar dos fases, una lquida y
una solida. Este sistema tiene tres grados de libertad termodinamicos, que pueden elegirse como
(T, P, x1 ), donde x1 es la fraccion molar de una de las componentes. Por cada una de las componentes
de la mezcla tenemos un potencial qumico j = j (T, P, x1 ) con j = 1, 2. A su vez, el potencial
qumico de cada componente sera diferente en cada fase (tenemos que pensar cada fase como un
subsistema diferente). Las condiciones de equilibrio seran entonces:
L
S
S
L
1 (T, P, x1 ) = 1 (T, P, x1 )
L
S
S
L
2 (T, P, x1 ) = 2 (T, P, x1 )
S
Estas son ecuaciones para los valores de las fracciones molares de equilibrio xL
1 y x1 . Vemos entonces
que para cada par de valores (T, P ) en principio es posible que exista solucion, es decir, coexistencia
de fases (esto no quiere decir que necesariamente haya coexistencia para todo valor de T y P ; eso
depende de las ecuaciones de estado en particular). Supongamos ahora que tenemos tres fases I,
II, y III coexistiendo en equilibrio. En este caso tienen que satisfacerse las condiciones

II
III
III
I1 (T, P, xI1 ) = II
1 (T, P, x1 ) = 1 (T, P, x1 )
II
III
III
I2 (T, P, xI1 ) = II
2 (T, P, x1 ) = 2 (T, P, x1 )

Tenemos cuatro ecuaciones y por lo tanto no existe solucion para valores arbitrarios de T y P .
Si fijamos el valor de la temperatura, podemos resolver las cuatro ecuaciones en las incognitas P ,
III
xI1 , xII
a una relacion P = P (T ), que corresponde a una lnea de puntos
1 y x1 . Esto determinar
triples. Si continuamos con esta lnea de razonamiento llegamos a la conclusion de que en una
mezcla binaria es posible la existencia de puntos cuadruples aislados, pero que no es posible tener
cinco fases en coexistencia.
1
Estamos despreciando aqui la tensi
on superficial de la interface entres fases. Esto es en general v
alido en las
condiciones de laboratorio, en las cuales estas transiciones se observan en presencia de gravedad. Sabemos que la
diferencia de presiones debida a la tensi
on superficial es proporcional a la curvatura de la superficie; en presencia de
gravedad las fases suelen separarse presentando una interface plana entre ellas, la cual tiene curvatura cero.

Termodinamica y Mecanica Estadstica I - Notas 2010

100

Estas mismas ideas pueden generalizarse a sistemas multicomponentes (o incluso a sistemas


otros tipos de grados de libertad). Sea un sistema con r componentes qumicas. El estado del
mismo puede ser descripto por los r + 1 parametros (T, P, x1 , . . . , xr1 ). Supongamos que tenemos
M fases diferentes en coexistencia. Tenemos r potenciales qumicos y todos ellos en la primera fase
seran funciones de las variables T, P, xI1 , . . . , xIr1 ; los potenciales qumicos en al segunda fase seran
II
funciones de las variables T, P, xII
mico (cada componente)
1 , . . . , xr1 , etc.. Por cada potencial qu
tenemos M 1 ecuaciones independientes que resultan de igualar el potencial entre las diferentes
fases. Tenemos entonces un total de r (M 1) ecuaciones a resolver en las variables T , P y las r 1
fracciones molares en cada una de las fases, es decir, un total de 2 + M (r 1) incognitas. Por lo
tanto, el n
umero variables a las cuales podemos en principio asignar valores arbitrariamente en una
mezcla de r componentes con M fases es:
f = 2 + M (r 1) r (M 1) = r M + 2
Esto se conoce como regla de las fases de Gibbs. En particular, implica que el n
umero
maximo de fases en coexistencia es M = r + 2 (f = 0).

11.3.

Transiciones de fase en sistemas simples

Vamos a analizar las caractersticas generales de una transicion de fase de primer orden en un
sistema simple monocomponente, entre dos fases genericas I y II.
11.3.1.

Potenciales termodin
amicos

Dado que en una transicion de primer orden coexisten dos fases diferentes, las cuales act
uan
como subsistemas en equilibrio que pueden intercambiar energa y materia, los parametros intensivos
deben tomar iguales valores en ambas fases. Esto es, ademas de la temperatura y la presion, el
potencial qumico debe ser igual en ambas fases. Pero para un sistema monocomponente el potencial
qumico es igual al potencial de Gibbs molar g(P, T ) y por lo tanto este toma los mismos valores en
ambas fases. En otras palabras, el potencial de Gibbs molar es contnuo en el punto de transicion.
El potencial de Gibbs total, por otra parte, viene dado por
G(T, P, N ) = GI (T, P, NI ) + GII (T, P, NII ) = NI g(T, P ) + NII g(T, P ) = N g(T, P )
donde NI y NII son los n
umeros molares de cada fase. Vemos entonces que el potencial de Gibbs
total es independiente de que fraccion del material se encuentra en cada una de las fases.
Analicemos entonces la forma general cualitativa del potencial de Gibbs. Consideremos primero
una curva de g en funcion de P a lo largo de una isoterma. Sabemos que g es una funcion concava
de P . Por otra parte,

v=

g
P

>0
T

de manera que g tendra pendiente positiva para todo valor de P . Dado que el vol
umen molar
cambia de manera discontnua, la pendiente sufre un salto en la presion de transicion Pt = Pt (T ).
La forma cualitativa de g en funcion de P y su derivada v(P ) a lo largo de una isoterma se muestra
cualitativamente en las Fig.19a y b.
Consideremos ahora la forma de las curvas g(T ) a P constante. Nuevamente g(T ) es una funcion
concava para todo T , pero en este caso la pendiente es siempre negativa, ya que

g
s=
T

>0
P

Termodinamica y Mecanica Estadstica I - Notas 2010

101

Figura 19: Comportamiento cualitativo del potencial de Gibbs molar g y sus derivadas v y s en
una transicion de fase de primer orden. (a) g en funcion de la presion a T constante. La pendiente
en el punto de transicion es discontnua, en correspondencia con el salto en el vol
umen molar. (b)
Isoterma v vs. P obtenida de derivar el potencial anterior. (c) g en funcion de la temperatura a P
constante. La pendiente en el punto de transicion es discontnua, en correspondencia con el salto
en la entropa molar. (b) Isobara v vs. T obtenida de derivar el potencial anterior.
La pendiente en el punto de transicion Tt = Tt (P ) nuevamente es discontnua debido a la existencia
de calor latente l = Tt s, donde la fase de alta temperatura tiene siempre mayor entropa que la
de baja temperatura. La forma cualitativa de g en funcion de T y su derivada s(P ) a lo largo de
una isobara se muestra cualitativamente en las Fig.19c y d. Por otra parte, tenemos que la entalpa
molar viene dada por
h=g+T s
de donde l = h.
Consideremos ahora el potencial de Helmholtz. De la relacion f = g P v vemos que, en el
punto de coexistencia, el potencial de Helmholtz molar toma diferentes valores en cada fase, esto
es,
fI = g P vI
fII = g P vII
Analicemos entonces la forma del potencial de Helmholtz molar f = f (T, v) en funcion del
vol
umen molar a T constante. Sabemos que f es una funcion convexa de v y pendiente negativa,
ya que

Termodinamica y Mecanica Estadstica I - Notas 2010

f
P =
v

102

>0
T

Supongamos vI < vII y supongamos que nos encontramos inicialmente en la fase de alta presion
P > Pt (T ) en la cual v < vI . A medida que nos aproximamos al punto de transicion v vI la
presion (y por lo tanto el valor absoluto de la pendiente de la curva) disminuye hasta alcanzar el
valor P = Pt . En ese punto una fraccion del sistema adopta abruptamente el valor v = vII y el
proceso contin
ua hasta que todo el sistema pasa a la fase II; a partir de ahi el vol
umen molar
contin
ua aumentando a valores v > vII y la presion contin
ua disminuyendo (por ejemplo, podemos
pensar que incialmente tenemos un lquido y entregamos calor de manera contnua). Tenemos
entonces dos ramas diferentes de la curva para v < vI y v > vII correspondientes a las dos fases
puras. Ambas ramas presentan la misma pendiente en los puntos v = vI y v = vII , ya que en la
coexistencia la presion es constante (ver Fig.20a), esto es

f
f
fI fII
Pt =
=
=

v vI
v vII
vII vI

(326)

Pensando ambas fases como susbsistemas en equilibrio, en la region de coexistencia tenemos


que el potencia de Helmholtz total vale
F = FI + FII = NI fI + NII fII
ya que la transicion ocurre a T constante; NI y NII son los n
umeros molares de la sustancia en
cada una de las fases. Por lo tanto
f = xI fI + xII fII

(327)

donde xI = NI /N y xII = NII /N con N = NI + NII el n


umero total de moles. Sean ademas
VI = vI NI y VII = vII NII los vol
umenes ocupados por cada fase y V = VI + VII . Tenemos que
v V /N . Esta cantidad representa el vol
umen molar total, pero debemos tener siempre en cuenta
que para vI < v < vII el sistema es heterogeneo y esta cantidad representa un vol
umen molar
promedio. Esto es, de la relacion
V = N v = VI + VII = NI vI + NII vII
tenemos que
v = xI vI + xII vII
y
xI + xII = 1
De estas dos ecuaciones podemos despejar las fracciones molares
xI

xII

vII v
vII vI
v vI
vII vI

(328)
(329)

Estas relaciones se conocen como regla de la palanca. Esto es, un punto intermedio en la parte
plana de una isoterma (ver Fig.20b) representa un sistema heterogeneo, en el cual la fraccion molar
de cada fase es igual a la distancia fraccional del punto al extremo opuesto de la region plana.

Termodinamica y Mecanica Estadstica I - Notas 2010

103

Figura 20: (a) Comportamiento cualitativo del potencial de Helmholtz molar f a temperatura
constante en una transicion de fase de primer orden, en la cual coexisten dos fases con vol
umenes
molares vI < vII . Para vI < v < vII f viene dado por la recta de pendiente Pt (T ) tangente a la
curva en los puntos vI y vII . (b) Isoterma P vs. v obtenida de derivar la curva anterior. Notemos
que la pendiente de esta curva es siempre negativa (excepto en la region plana, en la cual no hay
una u
nica compresibilidad), de acuerdo con el criterio de estabilidad T 0.

Termodinamica y Mecanica Estadstica I - Notas 2010

104

Reemplazando las Ecs.(328) y (329) en la Ec.(327) luego de algo de algebra y usando la condicion
de la igualdad de pendientes (326) tenemos que

f (T, v) = fI (v vI )

fI fII
vII vI

= fI Pt (v vI )

(330)

para vI < v < vII . Esto es, el potencial de Helmholtz molar en la region de coexistencia esta
representado por un segmento de recta de pendiente Pt , como se ilustra en la Fig.20a.
11.3.2.

Diagramas de fase

Un conjunto tpico de curvas de coexistencia en el espacio (P, T ) para un sistema simple monocomponente se muestra en la Fig.21. A bajas temperaturas y altas presiones, algunas sustancias
como el agua pueden presentar diversas fases solidas, con curvas de coexistencia solido-s
olido y
puntos triples entre diferentes fases solidas o entre dos fases solidas y el lquido.
El punto A es un punto triple donde las tres fases solido-lquido-gas coexisten en equilibrio. Para
el agua el punto triple se encuentra a 273,15 o K (recordemos que esta temperatura se toma como
referencia para definir la escala Kelvin) y a una presion de 611,73 Pa (aproximadamente 6 103
atm).
El punto C es sumamente particular y se conoce como punto crtico. En este punto termina
la lnea de vaporizacion y por encima del mismo podemos pasar contnuamente del lquido al gas.
La curva de fusion no presenta punto crtico (al menos no se concoce ning
un sistema que lo tenga):
para pasar de un solido a un lquido necesariamenente debe mediar una transicion de fase. Esta
diferencia entre las transiciones solido-lquido y lquido-gas indica que existe una diferencia mucho
mas fundamental entre solidos y lquidos que entre lquidos y gases. La mayor diferencia radica en
sus simetras. Como ya mencionamos en la seccion anterior, los solidos exhiben un tipo de orcen
ausente en los lquidos y gases. De hecho, liquidos y gases exhiben el mismo tipo de simetras
(homogeneos e isotropicos), siendo la u
nica diferencia entre ellos en una transicion su densidad. A
presiones y temperaturas suficientemente altas es posible cambiar contnuamente la densidad, de
manera que la distincion entre lquido y gas desaparece.
En la Fig.21 se muestra en lnea de trazos una curva de coexistencia solido-lquido con pendiente
negativa. Esto describe una situacion en la cual aumentando la presion el solido licua. Esto es lo
que ocurre con el agua y mas adelante veremos porque.
En la Fig.22 vemos el diagrama de fases correspondiente en el espacio (P, v). Las curvas de
coexistencia se transforman en este caso en regiones bidimensionales, en las cuales el sistema no
puede existir en forma homogenea. En lnea de trazos se muestran tres isotermas tpicas para
diferentes temperaturas. En todas estas isotermas la pendiente es negativa de acuerdo con el criterio
de estabilidad T > 0, excepto en la region de coexistencia en la cual se vuelven planas, como
vimos en la seccion anterior (esto no significa que la compresibilidad se anule, ya que el sistema
esta compuesto por dos fases cada una con compresibilidad positiva). Si nos adentramos en la
region de coexistencia, para T < Tc , la fraccion molar de cada fase esta dada por la regla de
la palanca. A medida que la temperatura aumenta aproxim
andose a Tc , la longitud de la region
plana de las isotermas en la transicion lquido-gas disminuye y finalmente se anula para T = Tc .
La isoterma T = Tc tiene un punto de inflexion a derivada nula en el punto crtico. Esto implica
que la compresibilidad T al aproximarnos al punto crtico. Esta divergencia tiene profundas
implicancias fsicas. Volveremos a analizar este punto en mayor profundidad mas adelante.
A altas temperaturas T Tc las isotermas adoptan una forma hiperbolica, ya que en este lmite
el comportamiento de cualquier sistema aproxima el del gas ideal.

Termodinamica y Mecanica Estadstica I - Notas 2010

105

slido

fusin

lquido

C
vaporizacin

A
gas
sublimacin

Figura 21: Diagrama de fases P vs. T tpico en un sistema simple monocomponente. La curva de
trazos corresponde a un sistema con comportamiento anomalo en la densidad, tal como el agua.

Figura 22: Diagrama de fases tpico P vs. v en un sistema simple monocomponente. Las curvas
de trazos corresponden a isotermas tpicas para diferentes temperaturas. Los puntos A y C se
corresponden con los de la Fig.21.

Termodinamica y Mecanica Estadstica I - Notas 2010

106

B'
A
A'

Figura 23: .
11.3.3.

Curvas de coexistencia: ecuaci


on de Clausius-Clapeyron

La forma de las curvas de coexistencia en la Fig.21 son menos arbitrarias de lo que parecen: su
forma esta determinada por las propiedades termodinamicas de las fases coexistentes.
Consideremos cuatro estados A, A0 , B y B 0 a lo largo de una curva de coexistencia, tal como
se muestra en la Fig.23. Los estados A y A0 se encuentran sobre el mismo punto de la curva, pero
corresponden a fases diferentes (podemos pensarlos como los lmites a derecha e izquierda del mismo
punto). Lo mismo ocurre con B y B 0 . Supongamos que la diferencia de presiones PB PA = PB 0 PA0
es infinitesimal (dP ) y lo mismo para la diferencia de temperaturas dT = TB TA . La pendiente
de la curva en el punto A es entonces dP/dT . El equilibrio de fases requiere que
A = A0
B = B 0
de donde restando ambas igualdades obtenemos
B A = B 0 A0
Pero
B A = d = s dT + v dP
donde hemos usado la ecuacion de Gibbs-Duhem; en forma semejante
B 0 A0 = d0 = s0 dT + v 0 dP
Igualando ambas expresiones y reacomodando terminos obtenemos:
dP
s
=
dT
v

Termodinamica y Mecanica Estadstica I - Notas 2010

107

donde s = s0 s y v = v 0 v son las discontinuidades en la entropa y el vol


umen molar
respectivamente. Dado que l = T s tenemos que

dP
dT

=
coex

l
T v

(331)

Esta se conoce como ecuacion de Clausius-Clapeyron.


Vemos que una pendiente positiva corresponde a un aumento en el vol
umen molar (o una
disminucion en la densidad molar) al pasar de la fase de baja a la de alta temperatura (el calor
latente siempre es positivo). Esta es la situacion mas frecuente. En el caso del agua sabemos que
el hielo tiene menor densidad que el agua lquida en el punto de fusion y por lo tanto la pendiente
de la curva de coexistencia es negativa.
11.3.4.

Curva de vaporizaci
on

Supongamos que evacuamos completamente una camara, la llenamos parcialmente con una
sustancia lquida, manteniendo la temperatura constante T . El sistema esta inicialmente fuera del
equilibrio y el lquido comenzara a evaporar, es decir, a tranformarse en vapor, aumentando la
presion del sistema. Si la temperatura se encuentra entre el punto triple y el punto crtico, este
proceso se interrumpira cuando la presion alcance la curva de coexistencia P = P (T ). En esta
situacion el sistema se mantiene en equilibrio, ya que, si la presion del vapor aumenta por encima
del valor de coexistencia, cierta fraccion del vapor condensara disminuyendo la presion del vapor;
por el contrario, si la presion del vapor es inferior al valor de coexistencia, cierta fraccion del lquido
se transformara en vapor aumentando la presion. En otras palabras, para una dada temperatura,
la presion del vapor y del lquido esta completamente determinada por la curva de coexistencia
y se denomina presi
on de vapor saturado o simplemente presion de vapor. Si cambiamos la
temperatura, la presion de vapor cambiar
a tambien, variando a lo largo de la curva de coexistencia.
La ecuacion de Clausius-Clapeyron determina esta variaci
on.
Podemos obtener una ecuacion simple para la curva de vaporizacion si hacemos algunas aproximaciones. Usualmente los gases son sumamente compresibles comparados con los lquidos (muy
poco compresibles) y en general vgas vliq . Podemos as asumir que el vol
umen molar del lquido
es despreciable frente al del gas (esta aproximaci
on es buena en tanto no estemos muy cerca del
punto crtico). Vamos a asumir ademas que el vapor satisface la ecuacion de estado de un gas ideal.
As
v = vgas vliq vgas R T /P
y la ecuacion de Clausius-Clapeyron toma la forma

dP
dT

=
coex

P lv
RT2

Asumiendo ademas que el calor latente de vaporizacion es aproximadamente independiente de la


temperatura (puede verse que esta aproximaci
on tambien es valida solo lejos del punto crtico)
podemos integrar la ecuacion anterior obteniendo
P (T ) = P0 elv /R T
Por lo tanto, a medida que la temperatura se incrementa, la presion de vapor crece exponencialmente a lo largo de la curva de coexistencia. Conversamente, si aumentamos la presion la
temperatura de vaporizacion aumenta.

Termodinamica y Mecanica Estadstica I - Notas 2010

11.4.

108

El modelo de Van der Waals para transiciones de primer orden

En los primeros captulos del curso vimos el fluido de Van der Waals como un modelo fenomenologico para gases interactuantes, es decir, como una aproximaci
on mas precisa de los gases reales que el
gas ideal. Este modelo fue presentado en realidad como un modelo para la transicion lquido-gas por
Van der Waals en su defensa de Tesis Doctoral en 1873. El mismo constituye hasta hoy el modelo
fenomenologico mas simple que exhibe las caractersticas escenciales de la transicion lquido-gas.
11.4.1.

Isotermas inestables

La emergencia de la transicion de fase en el modelo puede apreciarse claramente si analizamos


las isotermas que resultan de la ecuacion de estado
RT
a
(332)
2
vb v
las cuales se muestran en la Fig.24. Vemos que por debajo de cierta temperatura Tc , las isotermas
muestran un mnimo y un maximo locales. La aparicion de esta forma a bajas temperaturas puede
entenderse facilmente si invertimos la ecuacion anterior de la forma
P =

RT
a
ab
v b+
v2 + v
=0
(333)
P
P
P
Para valores fijos de T y P , esta es una ecuacion c
ubica para v, la cual puede presentar una o tres
raices reales. Un analisis del discriminante de esta ecuacion c
ubica muestra que para T > Tc existe
una sola raiz real P , mientras que para T < Tc existe siempre un rango de valores de P para el
cual existen tres raices reales, las cuales coalescen para T Tc . Para temperaturas T Tc las
isotermas aproximan la forma correspondiente a un gas ideal.
Resulta inmediato de la Fig.24 que para T < Tc existen intervalos de valores de los parametros
P y v para los cuales no se satisface el criterio de estabilidad termodinamica T > 0 o
3

P
v

<0
T

en la region entre el mnimo y el maximo locales de la isoterma. Esta region es por lo tanto no fsica
y constituye la marca de una transicion de fase. La existencia de dicha region implica un cambio
de convexidad en alguna relacion fundamental (esto es, convexidad en la relacion fundamental
entropica, o concavidad respecto del vol
umen en alg
un potencial termodinamico) la cual constituye
por lo tanto una relacion fundamental subyacente, como explicamos en el captulo anterior.
Veamos entonces la forma del potencial de Gibbs que se deriva de una isoterma inestable. Si
integramos la relacion de Gibbs-Duhem
d = s dT + v dP
a lo largo de una isoterma (T constante) tenemos
Z

v dP + (T )

(334)

donde (T ) es la constante de integraci


on. El integrando v(P ) se obtiene de resolver la Ec.(333) y
se muestra en la Fig.25. El mismo es una funcion multivaluada de P en el intervalo de presiones
entre los puntos B y N. Si tomamos como referencia un estado como el A, podemos calcular la
diferencia en el potencial de Gibbs molar entre dicho estado y uno cualquiera en la isoterma, por
ejemplo el B, como
gB gA =

Z B
A

v dP

(335)

Termodinamica y Mecanica Estadstica I - Notas 2010

Figura 24: Isotermas de Van der Waals para diferentes temperaturas.

Figura 25: Isoterma inestable (esquematica) de Van der Waals.

109

Termodinamica y Mecanica Estadstica I - Notas 2010

110

Figura 26: Potencial de Gibbs molar (esquematico) para el modelo de Van der Waals a temperatura
constante, obtenido por integracion de la isoterma de la Fig.25; la nomenclatura de los puntos se
corresponde con dicha figura.
Esto dara lugar a un potencial de Gibbs molar multivaluado, tal como se muestra en la Fig.26.
Analicemos este resultado. Al integrar de A hasta F , la funcion es univaluada, monotona creciente
(la derivada primera es el vol
umen, que es positivo) y concava (la derivada de v respecto de P es
negativa). Al continuar integrando a lo largo de la curva hasta el punto J, la presion disminuye
y g aumenta, generando una nueva rama F J por encima de la anterior. La pendiente de esta
nueva rama continua siendo positiva pero la curva es convexa, ya que su derivada segunda (derivada
primera de v) es positiva. A partir del punto J se genera una tercera rama, creciente, concava pero
por debajo de la segunda rama. A partir del punto N la curva vuelve a ser univaluada. La rama
F J es claramente inestable, ya que es convexa. Las dos ramas concavas se intersectan en el punto
D, L, que corresponde a la presion de transicion Pt . Para las presiones correspondientes a los puntos
entre B y N , tenemos tres valores posibles del potencial g para cada presion. Los puntos sobre la
rama inestable son no-fsicos. De las dos ramas estables el estado de equilibrio va a corresponder
a la rama de menor energa libre. As, para presiones menores a Pt , el potencial estara dado por
la rama A D, mientras que para P > Pt el potencial estara dado por la rama L O. Esta
sera la relacion fundamental termodinamica, que cumple con los requisitos que vimos en la seccion
anterior, mientras que el conjunto de las tres ramas constituyen la relacion fundamental subyacente.
El potencial de Helmholtz molar puede obtenerse de manera semejante.
11.4.2.

Construcci
on de Maxwell

La presion de transicion en la isoterma de la Fig.26 (o equivalentemente los puntos D y L)


esta determinada por la condicion gD = gL (igualdad de potenciales qumicos por la condicion de
equilibrio). De la Ec.(335) tenemos entonces
Z L
D

v dP = 0

(336)

Termodinamica y Mecanica Estadstica I - Notas 2010

111

Figura 27: Isoterma fsica en el modelo de Van der Waals. La isoterma subyacente es la
ABDF HJLN O, pero la construccion de Maxwell la convierte en la isoterma fsica ABDHLN O.
De la Fig.25 vemos que podemos expandir esta integral como
Z F
D

v dP +

Z H
F

v dP +

Z J
H

v dP +

Z L
J

v dP = 0

o
Z F
D

v dP

Z F
H

v dP =

Z H
J

v dP

Z L
J

v dP

(337)

La integral entre D y F corresponde al area bajo el arco D F en la curva de la Fig.25, mientras


que la integral de H a F nos da el area bajo el arco H F y por lo tanto el lado izquierdo de
la Ec.(337) nos da el area de la region 1 en la Fig.27. De la misma manera, el lado derecho de la
Ec.(337) nos da el area de la region 2 en la Fig.27. De esta manera, los puntos u
nicos L y D quedan
determinados por la condicion grafica
a
rea1 = a
rea2
la cual se conoce como construcci
on de Maxwell. De esta manera, para una dada temperatura
T < Tc , los vol
umenes molares del lquido vl y el gas vg quedan determinados conjuntamente con
la presion de transicion Pt por el conjunto de ecuaciones
Z vg
vl

P (v) dv = Pt (vg vl )

P (vl ) = P (vg ) = Pt
donde P (v) viene dada por la Ec.(332) (ver Fig.27). La parte inestable de la isoterma orignal
resulta entonces reemplazada por el segmento plano P = Pt para vl < v < vg determinado por la
construccion de Maxwell; esta isoterma modificada, constituye la isoterma fsica.
A partir de la construccion de Maxwell, podemos calcular tambien el calor latente integrando
la cantidad

Termodinamica y Mecanica Estadstica I - Notas 2010

ds =

s
v

112

dv
T

entre vl y vg . Usando relaciones de Maxwell tenemos entonces:


lv = T s = T
11.4.3.

Z vg
P
vl

dv = R T

Z vg
vl

dv
vg b
= R T ln
vb
vl b

Punto crtico

Para T Tc las tres raices reales coalescen en una sola. En otras palabras, la ecuacion c
ubica
(333) tiene en este punto una raiz triple y por lo tanto puede escribirse como
(v vc )3 = 0

(338)

Comparando los coeficientes de la Ec.(338) con los de la Ec.(333) evaluada en T = Tc , v = vc y P =


Pc ) pueden calcularse los valores de los parametros crticos. Alternativamente, dichos parametros
pueden calcularse del hecho de que en el punto crtico la isoterma correspondiente tiene un punto
de inflexion a derivada nula, esto es:

P
2 P
=

v vc ,Tc
v 2 v

=0
c ,Tc

las cuales deben resolverse conjuntamente con la ecuacion de estado. Los valores de los parametros
crticos resultan entonces:
vc = 3 b

Pc =

a
27 b2

R Tc =

8a
27 b2

Si reescribimos la ecuacion de estado en terminos de las variables reducidas: = P/Pc , = T /Tc


y = v/vc obtenemos:
=

3
8
2
3 1

(339)

Notemos que la Ec.(339) no contiene ninguna referencia a las caractersticas del material. En otras
palabras, esto predice que la ecuacion de estado en variables reducidas es una propiedad universal
de los gases. Esto se conoce como ley de estados correspondientes. En particular, esta implica
que la curva de coexistencia debera ser independiente del material si graficada en funcion de
variables reducidas. Este hecho se verifica experimentalmente, al menos en las cercanas del punto
crtico, tal como se muestra en la2 Fig.28.

Extraido de Introduction to Phase Transitions and Critical Phenomena, H. E. Stanley, Clarendon Press - Oxford,
1971

Termodinamica y Mecanica Estadstica I - Notas 2010

113

Figura 28: Curvas de coexistencia temperatura vs. densidad para 8 gases diferentes en funcion de
variables reducidas.

Termodinamica y Mecanica Estadstica I - Notas 2010

12.

114

Transiciones de fase en sistemas multicomponente

Fluidos compuestos por diferentes tipos de partculas interactuantes pueden exhibir una transicion de fase con segregacion, esto es, en la cual aparece una separacion del fluido en regiones
compuestas mayoritariamente por partculas de una u
nica componente qumica. El ejemplo mas
simple de este tipo de transicion ocurren las mezclas binarias.

12.1.

Mezclas binarias

Antes de analizar el fenomeno vamos a derivar un conjunto de relaciones termodinamicas particulares para este tipo de sistema que nos seran u
tiles. El potencial de Gibbs para una mezcla
binaria compuesta por N1 moles de tipo 1 y N2 moles de tipo 2 es
G = G(T, P, N1 , N2 ) = N1 1 + N2 2
y un cambio diferencial en el potencial de Gibbs viEne dado por
dG = S dT + V dP + 1 dN1 + 2 dN2
El potencial de Gibbs molar g = G/N es
g = x1 1 + x2 2
A T y P constantes la energa libre de Gibbs es una funcion homogenea de primer orden de
los n
umeros de moles (propiedad que se deriva de la homogeneidad de la relacion fundamental
energetica), esto es, G(T, P, N1 , N2 ) = G(T, P, N1 , N2 ). Eligiendo = 1/N tenemos que g =
g(T, P, x1 ), donde hemos usado que x1 + x2 = 1.
El potencial qumico de la componente 1 viene dado por

1 =

G
N1

=g+N
T,P,N2

g
x1

x1
N1

T,P

N2

= g + (1 x1 )

g
x1

T,P

En forma semejante

2 =

G
N2

T,P,N1

= g x1

g
x1

T,P

donde hemos usado que


x1
N1

N2

x2
=
N

x1
N2

=
N2

x1
N

Vemos asi que, al igual que g, los potenciales qumicos dependen de los n
umeros molares solamente
a traves de la fraccion molar de una de sus componentes. A partir de las expresiones anteriores es
facil demostrar tambien que

1
x1

T,P

2
x1

= (1 x1 )

T,P

= x1

2g
x21

2g
x21

(340)

T,P

(341)
T,P

Las condiciones de estabilidad termodinamica establecen que G debe ser una funcion convexa de
los n
umeros molares (parametros extensivos). Si llamamos i,j (i /Nj )P,T , tenemos entonces
que

Termodinamica y Mecanica Estadstica I - Notas 2010

1,1 > 0

115

2,2 > 0

(342)

y para variaciones conjuntas de N1 y N2


1,1 2,2 1,2 2,1 0

(1,2 = 2,1 )

(343)

A partir de la ecuacion de Gibbs-Duhem para T y P constantes


N1 d1 + N2 d2 = 0
es posible demostrar que

N1

1
N1

T,P,N2

+ N2

2
N1

=0
T,P,N2

N2

2
N2

T,P,N1

+ N1

1
N2

=0
T,P,N1

A partir de estas ecuaciones y usando las ecuaciones (341) y (340) es posible demostrar que las
condiciones (342) y (343) se reducen a

2g
x21

>0

(344)

T,P

(la demostracion queda como ejercicio para el lector). Esto es, la estabilidad qumica en una mezcla
binaria requiere que el potencial de Gibbs molar sea una funcion convexa de la fraccion molar. Una
violacion de esta condicion de estabilidad implica una transicion de fase en la cual coexistiran dos
fases con diferentes fracciones molares, esto es, fases con diferentes fracciones molares de cada una
de las componentes. Para entender como puede ocurrir esto debemos analizar la depedencia de g
con x1 .
Consideremos una mezcla con fraccion molar x1 y supongamos que inicialmente tenemos las
dos componentes puras en dos camaras separadas por una pared impermeable, ambas a la misma
temperatura y presion. El potencial de Gibbs molar sera entonces
g 0 = x1 01 + (1 x1 )02
donde 0j son los potenciales qumicos de las componentes puras. Si retiramos la pared restrictiva
se producira la mezcla y tendremos un cambio en el potencial g = u T s + P v dado por
g = u T s
(el vol
umen molar de la mezcla no cambia). Dado que el estado mezclado es mas desordenado que
el estado separado, la entropa necesariamente aumenta. Vamos asumir que el cambio en la entropa
es el mismo que ocurre en una mezcla de gases ideales, esto es
s = R [x1 ln x1 + (1 x1 ) ln(1 x1 )]
Mezclas cuya entropa de mezcla satisface esta ecuacion se conocen como soluciones regulares. Un
analisis simple muestra que s es una funcion positiva, simetrica de x1 en torno a x1 = 1/2, punto
en el cual presenta un maximo y se anula para x1 0 y x1 1, como se muestra en la figura 29b.
Notemos tambien que s tiene pendiente infinita en dichos puntos. El cambio en la entropa por

Termodinamica y Mecanica Estadstica I - Notas 2010

116

Figura 29: Contribuciones al potencial de Gibbs molar de una mezcla binaria. (a) Potencial de
componentes aisladas. (b) Entropa de mezcla. (c) Energia de la mezcla. (d) Forma tpica del
potencial de Gibbs molar.
lo tanto una contribucion negativa T s al potencial de Gibbs molar que es independiente de la
naturaleza de las componentes qumicas.
El cambio en la energa asociado con la mezcla depende de la energa de interacci
on entre las
moleculas dismiles V12 , comparado con la energa de interacci
on entre moleculas de una misma
sustancia V11 y V22 . Podemos tener una idea acerca de la contribuci
on de la mezcla a la energa
mediante un modelo basado en algunas suposiciones simples. Supongamos que cada molecula interact
ua en promedio con z otras moleculas y supongamos que z es independiente del tipo de
moleculas. La energa molar inicial sera
1
u0 = u01 + u02 = z [x1 V11 + (1 x1 ) V22 ]
2
Si la mezcla es completamente aleatoria, una partcula cualquiera tendra una probabilidad x1
de que en su entorno cercano de z partculas haya una partcula de tipo 1 y una probabilidad 1 x1
de que haya una partcula de tipo 2. La energa final es por lo tanto
u=

i
1 h 2
z x1 V11 + (1 x1 )2 V22 + 2 x1 (1 x1 ) V12
2

y la energa de mezcla
u =

1
z x1 (1 x1 ) [2 V12 V11 V22 ]
2

Si la energa de interaccion entre moleculas dismiles es mayor que el promedio de las energas de
interaccion entre moleculas del mismo tipo, la energa de mezcla es positiva y por lo tanto la mezcla
es energeticamente desfavorable. Las contribuciones a g se muestran en la figura 29. Vemos que la

Termodinamica y Mecanica Estadstica I - Notas 2010

117

Figura 30: Potencial de Gibbs molar de una mezcla binaria con energa de mezcla positiva para
diferentes temperaturas.
entropa de mezcla siempre contribuye a la convexidad de g (la mezcla es siempre entr
opicamente
favorable). Este termino compite con la energa de mezcla que es una funcion concava de x1 . El
parametro que regula esta competencia es la temperatura. A temperaturas suficientemente altas el
termino entr
opico siempre domina y el sistema homogeneo es estable para cualquier valor de x1 .
Por debajo de cierta temperatura crtica, el termino energetico compensa la entropa y produce una
region de inestabilidad, como se ilustra en la figura 30. Notemos que el gradiente de u es siempre
finito, mientras que s tiene pendiente infinita en los bordes x1 = 0, 1. Asi, para toda temperatura
T > 0 existen siempre regiones de estabilidad global, ya que el termino entr
opico siempre domina
suficientemente cerca de x1 = 0 y x1 = 1.
El analisis de las condiciones de equilibrio es enteramente analogo al de una transicion en un
sistema simple. Supongamos que tenemos dos fases I y II coexistiendo en equilibrio con fracciones
I
II respectivamente. Supongamos adem
molares xI1 y xII
as xI1 < xII
1 y potenciales g y g
1 , esto es, la
fase I esta predominantemente compuesta por partculas de tipo 2 y la fase II est
a predominantemente compuesta por partculas de tipo 1. En equilibrio tendremos
I1 = II
1
I2 = II
2
Usando las Ecs.(340) y (341) tenemos

g + (1

xI1 )

g I xI1

g
x1
g
x1

=g

II

+ (1

T,P

I
T,P

xII
1 )

= g II xII
1

g
x1

g
x1

II
T,P

II
T,P

Termodinamica y Mecanica Estadstica I - Notas 2010

118

Figura 31: Potencial de Gibbs molar esquematico de una mezcla binaria con separacion de fases.
Los puntos con tangente com
un son los valores de equilibrio en la coexistencia de fases.
Combinando estas ecuaciones obtenemos

g
x1

=
T,P

g
x1

II
T,P

(xI1

xII
1 )

g
x1

= g I g II

T,P

Estas expresiones nos dicen que los puntos xI1 y xII


un, la cual corre1 poseen una tangente com
sponde por lo tanto a la relacion fundamental termodinamica que restaura la convexidad de g (ver
Fig.31).
Supongamos ahora que tenemos la mezcla inicialmente en equilibrio a una temperatura T > Tc
con una fraccion molar x1 y bajamos a temperatura a un valor final T < Tc y dejamos equilibrar. La
mezcla se separa en dos fases con fracciones molares xI y xII , cuyos valores estaran determinados
por la temperatura final. Podemos preguntarnos que fraccion de la mezcla se encuentra en cada
fase, esto es, nos preguntamos acerca de las concentraciones, definidas como
cI

NI
N

cII

N II
N

donde N I = N1I + N2I y N II = N1II + N2II . Dado que


xI1 =

N1I
NI

xII
1 =

N1II
N II

tenemos
x1 =

II
N I + N1II
xI N I + xII
N1
1 N1
= 1
= 1
= xI1 cI + xII
1 cII
N
N
N

junto con la condicion


cI + cII = 1

Termodinamica y Mecanica Estadstica I - Notas 2010

119

Figura 32: Diagrama de fases para una mezcla binaria. C es el punto crtico. Si una mezcla homogenea, inicialmente a T0 > Tc se enfra por debajod e Tc , la misma se separara en dos fases segregadas
con fracciones molares xI1 y xII
1 , cuyas concentraciones respectivas se encuentran determinadas por
la regla de la palanca.
De estas dos u
ltimas ecuaciones podemos despejar las concentraciones:
cI =

xII
1 x1
II
x1 xI1

cII =

x1 xI1
I
xII
1 x1

Las concentraciones siguen la regla de la palanca.


La ausencia de una solucion estable homogenea a bajas temperaturas se conoce como gap de
solubilidad. A medida que la temperatura aumenta el gap de solubilidad se estrecha, esto es, los
valores de xI1 y xII
on
1 se aproximan a x1 , convergiendo a dicho valor para T = Tc . La determinaci
del punto crtico resulta mas facil en terminos de las ecuaciones de estado, esto es, de los potenciales
qumicos. Tomemos por ejemplo 2 = 2 (T, P, x1 ). De la Ec.(341) vemos que en las regiones estables
termodinamicamente (esto es, las regiones en que g tiene curvatura positiva) (2 /x1 )P,T < 0,
mientras que en la region inestable tendremos (2 /x1 )P,T > 0. En los puntos de cambio de
curvatura de g la derivada de 2 se anula y por lo tanto 2 tendr
a un maximo y un mnimo. De
esta manera, un grafico cualitativo de 2 en funcion de x1 tendra la misma apariencia que las
isotermas de Van der Waals P vs. v. En el punto crtico se produce el colapso de las dos soluciones
xI1 y xII
on horizontal. As, las condiciones
1 y por lo tanto la curva 2 (x1 ) presenta un punto de inflexi
en el punto crtico son

2
x1

2 2
x21

=0
T,P

!c

=0
T,P

El diagrama de fases esquematico en el espacio (x1 , T ) se muestra en la Fig.32.

Termodinamica y Mecanica Estadstica I - Notas 2010

12.2.

120

Equilibrio entre mezclas s


olidas y lquidas

Daremos a continuacion una descripcion breve del equilibrio entre fases solidas y lquidas en
mezclas binarias.
Un aspecto esencial de la solidificacion de una mezcla lquida es que el solido tendra en general
una composicion diferente al lquido, como veremos en seguida. Como resultado, a medida que
avanza la solidificacion, la composicion tanto del lquido como del solido que se esta formando
cambia. La mezcla lquida por supuesto se mantiene homogenea debido a que las moleculas en la
misma tienen alta mobilidad; el solido, por el contrario, acabara con una composicion inhomogenea
como resultado del cambio de composicion a medida que la solidificacion avanza. Para una mezcla,
el proceso de solidificacion se extiende sobre un intervalo de temperaturas, en lugar de tener lugar
a una temperatura u
nica como en el caso de una sustancia pura.
La Fig.33 ilustra este comportamiento. Consideremos una mezcla binaria que presenta una fase
solida y una lquida, sin gap de solubilidad en ninguno de los dos casos. El potencial de Gibbs tanto
de la fase lquida como de la fase solida sera una funcion convexa de x1 para cualquier valor de este
parametro. No obstante, las curvas de potencial en cada una de las fases a la misma temperatura
en general seran diferentes, como se muestra en la Fig.33a. En particular, esto ocurrira si las
sustancias puras 1 y 2 presentan diferentes temperaturas de fusion Tf 2 < Tf 1 . En este caso existe
un cruce de las curvas cuando Tf 2 < T < Tf 1 . El cruce de ambos potenciales que se muestra en
la Fig.33a implica una perdida de convexidad global (no local) entre los puntos de igual tangente,
S
correspondientes a las fracciones molares xL
quido y el solido respectivamente. Para
1 y x1 del l
temperaturas T > Tf 1 ambas sustancias puras seran lquidas, y por lo tanto la curva del potencial
del lquido para cualquier fraccion molar debe estar por debajo de la del solido. Conversamente,
para temperaturas T < Tf 2 la curva del lquido para cualquier fraccion molar debe estar por encima
de la del solido. As, al aumentar la temperatura de Tf 2 a Tf 1 , la curva del potencial de lquido
S
debe desplazarse hacia arriba relativa a la del lquido. Si se grafican las fracciones molares xL
1 y x1
en funcion de la temperatura se obtiene un diagrama de fases como el que se muestra en la Fig.33b.
Las curvas de coexistencia en este diagrama son llamadas de liquidus y solidus respectivamente.
Es claro que un diagrama de fases semejante se obtiene para el caso de una transicion gas-lquido
en una mezcla binaria sin gap de solubilidad. Sin embargo, existe una diferencia fundamental entre
ambos casos que se puede apreciar como sigue. Supongamos una mezcla con transicion lquidosolido del tipo antes explicada con una composicion inicial xL
1 a una temperatura inicial T0 por
encima de la lnea del liquidus (ver Fig.34). Si se enfra la mezcla, cuando la temperatura alcanza
el valor T1 sobre el liquidus, el solido se comienza a formar con composicion xS1 . Esta fase es rica en
la componente 1 y por lo tanto el lquido ve reducida su fraccion molar de la misma. Si se contin
ua
disminuyendo la temperatura, a medida que procede la solidificacion tanto la fraccion molar del
lquido como la del solido disminuyen, moviendose a lo largo de las lneas del liquidus y el solidus
como se indica en la Fig.34. Dado que las moleculas en el solido no tienen mobilidad, el mismo
presentara una composicion inhomogenea. Esto no ocurre en el caso de una transicion gas-lquido:
una vez que todo el gas ha licuado, la composicion final es la misma que la inicial.
Los diagramas de fase reales pueden ser extremadamente complicados. Puede haber gap de
solubilidad tanto en la fase solida como lquida. Tambien pueden existir diversas fases solidas con
diferentes estructuras cristalinas, las cuales pueden coexistir con el lquido.
En la Fig.35 se ilustra el comportamiento tpico para el caso en que existen dos fases solidas de
diferentes estructuras cristalinas (denominadas y ), asociadas a cada una de las componentes
de una mezcla binaria. Suponemos que el lquido no presenta gap de solubilidad para el intervalo
de temperaturas de interes. Las energas libres molares de las formas cristalinas puras decaen
inicialmente al incorporar la segunda componente, debido al gradiente infinito de la entropa de

Termodinamica y Mecanica Estadstica I - Notas 2010

121

Figura 33: Equilibrio entre fases solida y lquida de una mezcla binaria, de las cuales ninguna
presenta gap de solubilidad. (a) Potencial de Gibbs molar de las fases solida y lquida para una
temperatura T 0 entre las temperaturas de fusion de las componentes puras Tf 2 < T 0 < Tf 1 . (b)
Diagrama de fases correspondiente.

Figura 34: Cambio en la composicion durante la solidificacion de una mezcla binaria.

Termodinamica y Mecanica Estadstica I - Notas 2010

122

mezcla para3 x = 0 y x = 1 . A medida que se incorpora mas sustancia de una de las dos
componentes, la estructura cristalina comienza a ser energeticamente desfavorable para la segunda
componente, lo cual lleva finalmente a un incremento de la energa libre. As, cada una de estas
curvas presenta un mnimo como funcion de x.
Por otra parte, la energa libre molar del lquido presenta un maximo ancho, como resultado
de la predominancia de la entropa de mezcla para todo valor de x (recordemos que el lquido no
presenta gap de solubilidad). Para cualquier compsicion, el lquido es siempre mas desordenado que
el solido. As, la energa libre del lquido es inferior a las de ambas fases solidas a altas temperaturas.
A medida que la temperatura disminuye, el efecto entr
opico pierde peso frente a las diferencias de
energa y la curva del lquido sube respecto de las de las fases solidas. La Fig.35 ilustra las diferentes
etapas del proceso de fusion. A altas temperaturas (a) el lquido tiene menor energa libre que ambas
fases solidas para cualquier composicion. Al disminuir la temperatura la curva del lquido cruza
primero la de la fase solida con mayor temperatura de fusion (en este ejemplo la sustancia 1) y
surge una region de equilibrio heterogeneo, consistente en lquido coexistiendo con solido con alta
concentracion de la sustancia 1 (Fig.35b). Al continuar disminuyendo la temperatura, la curva del
lquido cruza la del solido en x = 0 y surge una segunda region de coexistencia entre el lquido y
una fase conpuesta en su mayora por la sustancia 2 (Fig.35c). El potencial del lquido contin
ua
aumentando a medida que disminuye la temperatura y el rango de composiciones para las cuales el
lquido es estable se estrecha, hasta que desaparece cuando las dos tangentes coinciden (Fig.35d).
Esta condicion define una temperatura mnima u
nica a la cual el lquido puede existir. Esta se
denomina temperatura eut
ectica y la correspondiente fraccion molar composici
on eut
ectica.
A temperaturas inferiores a la eutectica (e) el sistema presenta un gap de solubilidad simple entre
las dos fases solidas.
En la (Fig.35f) se muestra el diagrama de fases temperatura-composicion a presion constante
de este sistema.
Un lquido con la composicion xeu se conoce como soluci
on eutectica. Una solucion eutectica
solidifica rapidamente y de manera homogenea, lo que le confiere propiedades mecanicas importantes en metalurgia. El solido eutectico, presenta una macroestructura heterogenea, generalmente
compuesta de laminas alternadas de ambas fases de unos pocos micrones de espesor.
Notemos que el punto eutectico (xeu , Teu ) es un punto triple en el que coexisten las dos fases
solidas y el lquido. Los valores de compsicion y temperatura en este punto dependen de la presion.
As, al variar la presion tendremos una linea de puntos triples, en acuerdo con la regla de las fases
de Gibbs.

De aqui en mas vamos a omitir el subndice 1 de la fracci


on molar para simplificar la notaci
on

Termodinamica y Mecanica Estadstica I - Notas 2010

123

Figura 35: Las figuras (a)-(e) muestran las curvas del potencial de Gibbs molar que llevan al
diagrama de fases (f). Teu y xeu son la temperatura y composicion eutecticas respectivamente. Los
subndices en las temperaturas de la Fig.(f) hacen referencia a los paneles (a)-(e).

Termodinamica y Mecanica Estadstica I - Notas 2010

13.

124

Transiciones de fase contnuas

Como definimos en el captulo 11, una transicion de fase se caracteriza por una perdida de
analiticidad en una relacion fundamental. En el caso de una transicion de primer orden, la perdida
de analiticidad se manifiesta como una discontinuidad en una o mas derivadas primeras de una
relacion fundamental. En contraposicion, una transicion de fase es llamada contnua cuando todas las derivadas primeras de la cualquier relacion fundamental son contnuas en la region de no
analiticidad. Sin embargo, esta caracterizacion es sumamente general e incompleta, englobando
diferentes tipos de transiciones. El tipo mas frecuente de transicion contnua se conoce como transicion de segundo orden o fen
omeno crtico. Daremos a continuaci
on una breve descripcion de
la termodinamica de los fenomenos crticos.

13.1.

Fenomenologa

El paradigma de una transicion continua (y de hecho la primera que fue estudiada en profundidad) es la conversion de los solidos llamados ferromagneticos de un estado paramagnetico a uno
ferromagnetico, a una temperatura muy precisa llamada temperatura de Curie Tc . El ejemplo tpico
es el hierro cuya temperatura de Curie es Tc = 1043 K.
Para T > Tc el material es paramagnetico, es decir, en ausencia de campo magnetico externo presenta magnetizacion nula, mientras que en presencia de un campo debil presenta una magnetizacion
proporcional al campo. En la fase ferromagnetica (T < Tc ) el material se magnetiza a
un en ausencia
de campo externo, en alguna direccion particular. Decimos que el material presenta magnetizaci
on
~ 0 (T ). En algunos materiales la orientaci
espontanea M
on de la magnetizacion espont
anea ocurre
al azar. Estos son los feromagnetos isotr
opicos. En otros materiales, la magnetizacion espont
anea
tiende a alinearse preferencialmente en la direccion de alguna direccion particular asociada a la
estructura cristalina (llamado eje de magnetizacion facil); estos se conocen como ferromagnetos
uniaxiales.
Microscopicamente un solido magnetico puede pensarse como un arreglo regular de momentos
magneticos elementales (spines) en una red cristalina. En el estado paramagnetico los momentos
elementales apuntan en direcciones aleatorias y por lo tanto la magnetizacion total (suma de los
momentos elementales) es cero. Este es por lo tanto un estado microscopicamente desordenado. Por
el contrario, en un estado ferromagnetico los momentos se encuentran alineados mayoritariamente
en la misma direccion, dando como resultado una magnetizacion neta no nula. Este es un estado
microscopicamente ordenado. Se dice entonces que el sistema presenta orden de largo alcance.
~ 0 (T )|/V se
La forma tpica del modulo de la magnetizacion espontanea especfica m0 (T ) |M
muestra en la figura 36. Por otra parte, en presencia de campo magnetico externo la magnetizacion
tiende a alinearse con el mismo, en tanto que su modulo presenta una dependencia no-lineal con
la intensidad del campo. Notemos que la derivada de m0 (T ) es discontinua en Tc y esto parece de
acuerdo con la clasificacion de Ehrenfest (la magnetizacion es la derivada primera de una energa
libre respecto del campo magnetico) y de ahi el orgen del nombre segundo orden; sin embargo,
esta no es una simple discontinuidad, ya que para T Tc la derivada primera de m0 diverge con
una ley de potencia. Mas precisamente, para T Tc
m0 (T ) (Tc T )
lo cual define el exponente crtico 0 < < 1. Valores tpicos medidos arrojan valores del orden de
0,36 (ej., para Fe: = 0,37 0,1; Ni: = 0,358 0,003).
Por otra parte, el calor especfico a campo nulo (derivada segunda de la energa libre) diverge en
Tc de la forma

C(T ) |T Tc |

para

T Tc

1
T

125

m (T)/m0(0)

Termodinamica y Mecanica Estadstica I - Notas 2010

0
0

T/Tc

Figura 36: Magnetizacion espontanea en funcion de T /Tc para un material ferromagnetico.


en general es peque
no, ej. para el Ni: = 0,04 0,12. Otra cantidad que diverge con una ley de
potencia es la susceptibilidad magnetica a campo nulo:

(T ) =

m
B

T B=0

|T Tc |

para

T Tc
1

T
c

Por otra parte, a lo largo de la isoterma crtica T = Tc la magnetizacion varia con el campo externo
con una ley de potencia m(B, Tc ) B 1/ ( > 1) cuando B 0 (ver Fig.37). La relacion de
los diferentes exponentes crticos asociados a la magnetizacion con los diferentes comportamientos
asintoticos se ilustra en la Fig.37.
Otro fenomeno relacionado ocurre en la transicion de fase gas-lquido. Esta presenta en el diagrama presion vs. temperatura una linea de primer orden la cual termina en un punto crtico. Que
relacion guarda esto con el ejemplo antes mencionado? Podemos entender esta relacion analizando
el comportamiento del sistema en la region de coexistencia de fases que se muestra en la Fig.38.
Tomemos una isoterma arbitraria y sean G (T ) y L (T ) las densidades del gas y del lquido respectivamente en la curva de coexistencia. Si ahora aumentamos la temperatura aproxim
andonos de Tc
la diferencia de densidades L (T ) G (T ) tiende a cero, mostrando un comportamiento analogo
al de la magnetizacion espontanea mostrado en la Fig.36. Mas a
un, esta diferencia tiende a cero
mediante una ley de potencia asintotica (ver Fig.28)
L (T ) G (T ) (Tc T )

para

Tc T
1.
Tc

Esto en principio podra no tener nada que ver con el otro fenomeno. Sin embargo se observa
experimentalmente que el exponente crtico es el mismo para cualquier sustancia con un valor
aproximado de = 0,33, muy semejante al de ciertos ferromagnetos, tales como Fe y Ni. Mas a
un,
el exponente en el punto crtico de la transicion gas-lquido resulta independiente de la sustancia
particular por la ley de estados correspondientes (ver Fig.28). Pero la analoga no termina ahi.
El calor especfico tambien diverge con una ley de potencia en Tc , esto es, si enfriamos desde
T > Tc manteniendo la densidad constante = c tenemos que C(T ) (T Tc ) , con valores
de nuevamente semejantes a los del ferromagneto. Si ademas consideramos que las variables

Termodinamica y Mecanica Estadstica I - Notas 2010

126

m(B,T)
~ |T-Tc|

T < Tc
Tc

m0(T) ~ (Tc-T)

m ~ B1/

T > Tc
~ |T-Tc|

Figura 37: Magnetizacion especfica en funcion del campo externo B para diferentes temperaturas
y comportamientos asintoticos en torno del punto crtico (T, B) = (Tc , 0).

P
T = cte

Pc

G(T)

L(T)

Figura 38: Diagrama de fases presion vs. densidad para la transicion gas-lquido.

Termodinamica y Mecanica Estadstica I - Notas 2010

127

termodinamicas analogas entre un fluido y un sistema magnetico son M V y B P , el analogo


de la susceptibilidad magnetica en el fluido es la compresibilidad isotermica T . Ya hemos visto
que T diverge en el punto crtico. Se observa que la misma presenta el mismo tipo de divergencia
que el ferromagneto con un exponente crtico tambien semejante e independiente de la sustancia
particular!! Para completar el panorama, a lo largo de la isoterma crtica y en la proximidad del
punto crtico, la densidad vara con la presion como | c | |p pc |1/ y con el mismo exponente
crtico que el ferromagneto ( 5).
Una fenomenologa semejante se observa en las cercanas del punto crtico de una mezcla binaria
con gap de solubilidad.
Otro fenomeno sumamente interesante que ocurre en el punto crtico de un fluido simple se
conoce como opalescencia crtica. Si tomamos un fluido transparente encerrado en un recipiente
transparente con densidad igual a la crtica y variamos la temperatura, al atravezar el punto crtico
el fluido se vuelve opaco con una tonalidad lechosa, retomando su transparencia al continuar variando la temperatura. Este efecto nos dice que en la criticalidad el ndice de refraccion del fluido
vara como resultado de la existencia de fluctuaciones de densidad sobre regiones de diferentes
tama
nos (burbujas), ya que el fluido dispersa luz en todo el espectro visible. Este efecto esta directamente relacionado con la divergencia en la compresibilidad isotermica. Una compresibilidad
infinita dara como resultado que las fluctuaciones de presion (siempre presentes), a
un siendo muy
peque
nas, provoquen grandes fluctuaciones de densidad.
Este efecto es una clave central en la comprension de los fenomenos crticos, si bien la explicacion
de los mecanismos detras de este fenomeno exceden el alcance del presente curso.
Otro ejemplo de sistema que presenta comportamiento crtico es el 4 He a bajas temperaturas
( 2 K), cuyo diagrama de fases se muestra en la Fig.39a. En un rango de presiones entre valores
cercanos al cero y 25 atm., el 4 He sufre una transicion de un estado de fluido normal (llamado
He I) a un estado superfluido (llamado He II). En el estado superfluido el 4 He presenta una serie
de propiedades bastante inusuales, como por ejemplo un flujo sin disipacion en tubos capilares
(a veces llamado efecto fuente). Este fenomeno esta estrechamente relacionado a la transicion de
Bose-Einstein, siendo por lo tanto un fenomeno de origen netamente cuantico. La transicion de
fluido normal a superfluido se suele llamar transici
on debido a la forma caracterstica del calor
especfico, la cual se muestra en la Fig.39b. La divergencia en el calor especfico es en este caso es
de tipo logartmica:
C A log |T T |
Existen muchsimos mas ejemplos de sistemas que presentan este tipo de transiciones de fase
caracterizadas por divergencias con exponentes crticos muy semejantes. Significa esto que los
exponentes crticos son independientes (dentro del error experimental) del sistema? La respuesta es no. Puede verse que los sistemas crticos pueden agruparse en categoras, donde los sistemas pertenecientes a una misma categora presentan todos los mismos exponentes crticos. Este
fenomeno se conoce como universalidad y las distintas categoras como clases de universalidad.
La transicion para-ferro (en un ferromagneto uniaxial) y el punto crtico de la transicion lquido-gas
pertenecen a la misma clase de universalidad. El hecho de que sistemas tan diferentes tengan los
mismo exponentes crticos nos indica que estamos en presencia de un fenomeno altamente complejo
y con implicancias fsicas sumamente profundas. De que depende que un sistema presente un dado
conjunto de valores para los exponentes crticos? Dicho de otra manera, que propiedades del sistema determinan su pertenencia a una dada clase de universalidad? Para responder a esta pregunta
tenemos que introducir algunos conceptos que nos permitan englobar en una misma descripcion
sistemas de naturaleza diferente.

Termodinamica y Mecanica Estadstica I - Notas 2010

128

(a)
slido
transicin
He I
fluido normal

He II
superfluido

gas

T
C

(b)

T
T

Figura 39: (a) Diagrama de fases presion vs. densidad para el 4 He; (b) Calor especfico a presion
constante vs. temperatura en la transicion .

Termodinamica y Mecanica Estadstica I - Notas 2010

13.2.

129

Caracterizaci
on de las transiciones de fase continuas

Un concepto muy importante para la descripcion unificada de las transiciones de fase continuas es el de par
ametro de orden, el cual fue introducido por Landau. La idea general es que
en cualquier transicion de fase continua es posible identificar una cantidad macroscopica (esto es,
relacionada de alguna manera con parametros termodinamicos del sistema), la cual se anula identicamente en una de las fases (generalmente la fase de altas temperaturas T Tc ) y es diferente de
cero en la otra fase (generalmente a bajas temperaturas T < Tc ). En una transicion de fase continua este parametro es continuo en Tc , con lo cual tiende a cero continuamente al aproximarnos
a Tc desde temperaturas menores. El ejemplo tpico es la magnetizacion en un ferromagneto. El
parametro de orden no necesariamente es un escalar, pudiendo ser un vector. Vamos a denominar D
el n
umero de componentes del parametro de orden. En el caso general de un ferromagneto D = 3, si
bien en el caso de ferromagnetos uniaxiales el parametro de orden se reduce a un escalar. Vamos a
~ En el caso de la transicion gas-lquido tenemos que = L G .
denominarlo en forma generica .
Esto permite la definicion general del exponente crtico a traves del comportamiento asint
otico

~
(Tc T )

para

T < Tc

Cada parametro de orden tiene asociado un parametro termodin


amicamente conjugado, al cual
~
~
llamaremos genericamente B, que tiene la misma dimension D del parametro de orden; sea B |B|.
En el caso en que el parametro de orden se relaciona de manera directa con una variable termodinamica extensiva (magnetizacion, densidad o vol
umen especfico) el parametro termodinamicamente conjugado es simplemente la variable intensiva que resulta de derivar la energa libre
respecto del parametro de orden (campo magnetico o presion). En otros casos mas complicados,
donde el parametro de orden no esta tan claramente identificado con una variable termodinamica,
la identificacion del parametro conjugado puede no ser muy simple.
El punto crtico queda entonces determinado por un par de valores (Tc , Bc ) ((Tc , 0) para un ferromagneto, (Tc , Pc ) para un fluido, etc.) Podemos entonces definir una susceptibilidad generalizada

~

T B=Bc

Con estas definiciones podemos introducir de manera formal los exponentes y a traves de los
comportamientos asintoticos:
|T Tc |

para


~
|B Bc |1/

|T Tc |/Tc 1
para

T = Tc

Las clases de universalidad estan determinadas solo por tres cosas: 1) la dimension espacial
del sistema (sistemas bidimensionales tienen diferentes exponentes que los tridimensionales); 2) la
dimension D del parametro de orden y 3) las simetras del sistema. Por ejemplo, un ferromagneto
isotropico es invariante ante rotaciones arbitrarias del sistema; por el contrario, un ferromagneto
uniaxial es invariante ante reflexiones del eje de magnetizacion facil, etc.
Existe otro hecho notable y es que los exponentes crticos no son independientes entre s. Esto
podra en principio parecer no tan sorprendente, ya que todos los exponentes se derivan en u
ltima
instancia de una misma relacion fundamental (para un dado sistema). Sin embargo, como expusimos en el primer cap`tulo del curso, la termodinamica no nos da predicciones precisas acerca del
comportamiento cualquier sistema, sino que nos da cotas para las cantidades medibles. As, por
ejemplo, es posible mostrar que las condiciones de estabilidad termodinamicas imponen que

Termodinamica y Mecanica Estadstica I - Notas 2010

130

+ 2 + 2
(desigualdad de Rushbrooke) y
+ (1 + ) 2
(desigualdad de Griffiths). Sin embargo, dentro del error experimental, se observa que estas relaciones se cumplen como igualdades para todos los sistemas crticos. Mas a
un, existen varios
modelos exactamente solubles en la Mecanica Estadstica que presentan fenomenos crticos (el
modelo de Van der Waals es uno de ellos); en todos estos modelos se verifica que
+ 2 + = 2
+ (1 + ) = 2
Estas igualdades se conocen como leyes de escala y constituyen uno de los aspectos claves
para la comprension de la fsica de los fenomenos crticos.

Captulo 1

Introducci
on a la Teora de
Probabilidad
Para la mayora de la gente, probabilidad es un termino vago utilizado en el lenguaje cotidiano
para indicar la posibilidad de ocurrencia de un evento futuro. As, hablamos de la probabilidad de
que llueva ma
nana, la probabilidad de que suba el dolar, etc. En ciencia el concepto de probabilidad
se utiliza para hacer inferencias, esto es, predicciones acerca de ciertos procesos cuyo resultado es
variable cada vez que se repiten. As, por ejemplo, no se puede predecir con exactitud cual sera la
presion arterial de una persona en un momento dado, ni si la moneda arrojada caera de un lado o
del otro. Este tipo de procesos, dan un resultado diferente dentro de un cierto conjunto de valores
cada vez que se repiten, pero la frecuencia relativa con que ocurre cada valor en una gran serie
de observaciones es a menudo estable. Si arrojamos un n
umero grande de veces la misma moneda
(suponiendo que no este cargada) observaremos que aproximadamente la mitad de las veces sale
cara y la otra mitad seca. Procesos que presentan estas propiedades se denominan aleat
orios o
estoc
asticos. Dicha frecuencia relativa estable nos da una medida intuitiva (pero significativa) de la
posibilidad de ocurrencia de un evento aleatorio en una observaci
on futura y constituye la definicion
estadstica de probabilidad. Supongamos que el resultado de un experimento esta descripto por
una variable X, que puede tomar valores de un conjunto finito x1 , x2 , . . . , xn . Supongamos que
repetimos el experimento N veces y sea Ni el n
umero de veces que la variable tomo el valor xi , con
i = 1, . . . , n. Podemos entonces definir la probabilidad Pi de observar el valor xi como:

Pi = lm

Ni
N

(1.1)
P

Dado que ni=1 Ni = N , tenemos que 0 Pi 1 para i = 1, . . . , N y ni=1 Pi = 1.


Notemos que la Ec.(1.1) es una definicion a posteriori, esto es, para conocer la probabilidad de
ocurrencia de un resultado en un experimento, primero debemos realizar el experimento un n
umero
grande de veces. Por otra parte, no tenemos manera de probar que este lmite realmente existe y
es independiente del conjunto de experimentos, lo cual debe ser asumido como un axioma. Vamos
entonces a buscar una formulacion que nos permita estimar probabilidades a priori, a partir de
propiedades intrnsecas del sistema. Para ello vamos a plantear un conjunto diferente de axiomas.
Sin embargo, el concepto anterior nos resultara u
til como gua para una definicion mas formal, ya
que vamos a exigir que ambas definiciones coincidan en la circunstancias apropiadas. Supongamos
entonces que un posible resultado de un experimento es A y que por alg
un metodo le asignamos una
probabilidad de ocurrencia P (A). Entonces si llevamos a cabo N experimentos identicos, esperamos
que el evento A ocurra aproximadamente un n
umero N P (A) de veces. De hecho, vamos a exigir
que en el lmite de N muy grande la fraccion relativa de veces que ocurre A converja a P (A).
11

12

1.1.

Definiciones b
asicas y axiomas

Vamos a comenzar definiendo el espacio muestral de un experimento como un conjunto S,


tal que cualquier resultado del experimento corresponda a uno o mas elementos de S. Un evento
es cualquier subconjunto de S. Un evento simple es un elemento del conjunto. Dos eventos A y
B se dicen mutuamente excluyentes si A B = ; eventos simples son siempre mutuamente
excluyentes.
La probabilidad de un evento A S se define como una funcion P : S [0, 1] con las
siguientes propiedades:
1. Axioma 1: P (S) = 1
2. Axioma 2: Para cualquier secuencia (finita o infinita) de eventos Ei mutuamente excluyentes
entre s, esto es, Ei Ej = para todo par i 6= j, entonces
P

Ei

i=1

P (Ei )

i=1

Las siguientes propiedades se deducen de manera inmediata.


Si tomamos como Ei todos los eventos simples (esto es, todos los elementos de S) sabemos
S
P
que S = i Ei y del axioma 2 se sigue que P (S) = i P (Ei ). Del axioma 1 tenemos entonces
que
X

P (Ei ) = 1

Esta propiedad es valida en general para cualquier secuencia de eventos (subconjuntos) mutuamente excluyentes y exhaustiva, esto es, una secuencia tal que S = i Ei . Un caso particular
de lo anterior es el siguiente. Sea E un evento cualquiera y sea E su complemento, esto es,
S = E E, con E E = . Entonces se sigue que P (E) = 1 P (E).
Dado que el conjunto vaco es el complemento de S, del resultado anterior entonces P (S) +
P () = 1. Por el axioma 1 se sigue que P () = 0.
Las propiedades anteriores tienen una interpretaci
on bastante directa. P = 1 implica una certeza
absoluta en el resultado del experimento. Un resultado del experimento con probabilidad uno es
determinista. As, la probabilidad de que algo ocurra P (S) = 1. Por otra parte, un resultado con
probabilidad cero implica que el mismo no ocurrira nunca. As, la probabilidad de que no ocurra
nada es P () = 0, ya que el experimento siempre arroja algun resultado.
El axioma 2 nos da una regla de aditividad para las probabilidades. La probabilidad de eventos
que no pueden ocurrir simultaneamente es la suma de las probabilidades de los eventos correspondientes.
Dados dos eventos A y B, P (A B) nos da la probabilidad de que ocurra A, B o ambos a
la vez. Por otra parte, P (A B) es la probailidad de ocurran ambos eventos simultaneamente y
solo eso. Esta u
ltima se denomina probabilidad conjunta de A y B. Estas probabilidades estan
relacionadas a traves de
P (A B) = P (A) + P (B) P (A B)

(1.2)

Esta propiedad puede demostrarse facilmente mediante el diagrama de Venn de la Fig.1.1. El


conjunto P (A B) puede dividirse en tres conjuntos disjuntos: I, II y III (eventos mutuamente

13

Figura 1.1: Diagrama de Venn para la union de dos eventos.

excluyentes). En otras palabras, I es el conjunto de todos los elementos en A que no estan en B,


III lo inverso y II el conjunto de todos los elementos que pertenecen simult
aneamente a A y B.
As II = A B, A = I II y B = III II. Ademas
A B = I II III
Dado que I, II y III son mutuamente excluyentes
P (A B) = P (I) + P (II) + P (III)
P (A) = P (I) + P (II)
P (B) = P (II) + P (III)
de donde se obtiene la Eq.(1.2).
En muchos experimentos resulta natural asumir que todos los resultados posibles (eventos simples) tienen la misma probabilidad de ocurrencia. As, por ejemplo, si nuestro experimento es
arrojar una moneda, el espacio muestral sera S = {cara, seca}. Si la moneda no esta cargada,
es de esperar que ambos eventos simples tengan la misma probabilidad. Otro ejemplo puede ser
al resultado de arrojar un dado de 6 caras. El espacio muestral consiste de 6 eventos simples
S = {E1 , E2 , E3 , E4 , E5 , E6 }, donde Ei corresponde al resultado i. Para un dado no cargado todos
estos resultados deberan tener la misma probabilidad. Consideremos entonces un caso generico de
N posibles resultados Ei con i = 1, . . . , N . Dado que
N
X

P (Ei ) = 1

i=1

se sigue inmediatamente que


P (Ei ) =

1
N

As, en el ejemplo de la moneda P (Ei ) = 1/2 y para el ejmplo del dado P (Ei ) = 1/6. De esto se
sigue que, en un espacio muestral finito, para cualquier evento E

14

n
umero de elementos en E
(1.3)
n
umero de elementos en S
En otras palabras, si asumimos que todos los resultados de un experimento son igualmente probables, la probabilidad de cualquier evento E es igual a la fraccion de elementos en el espacio muestral
contenidos en E. Por ejemplo, para el caso del dado, la probabilidad de que el resultado sea menor
que 3 sera P (E) = 2/6 = 1/3.
Un concepto de gran utilidad es la probabilidad condicional P (A|B), la cual nos da la
probabilidad de que ocurra el evento A dado que tenemos la certeza de que ocurre B. P (A|B) se
define por la ecuacion
P (E) =

P (A|B) =

P (A B)
P (B)

(1.4)

Podemos entender esta ecuacion si consideramos el ejemplo simple de un espacio muestral con
N eventos equiprobables. Sea NA , NB y NAB el n
umero de elementos contenidos en A, B y A B
respectivamente. Entonces, P (A) = NA /N , P (B) = NB /N y P (A B) = NAB /N . Dado que
tenemos la certeza de que ocurre B, para esta situacion particular B es nuestro espacio muestral.
Dado que todos los eventos en B a su vez son equiprobables, tenemos que P (A|B) = NAB /NB .
Dividiendo numerador y denominador de la ecuacion anterior por N se obtiene la Ec.(1.4). Dado
que P (A B) = P (B A), tenemos tambien que
P (A|B) P (B) = P (B|A) P (A)

(1.5)

El concepto de probabilidad condicional nos permite introducir el concepto de eventos independientes. Dos eventos A y B son independientes si y solo si:
P (A|B) = P (A)

(1.6)

De la Ec.(1.5) esto implica inmediatamente que P (B|A) = P (B). Por otra parte, de la Ec.(1.4)
tenemos que
P (A B) = P (A) P (B)

(1.7)

esto es, si dos eventos son independientes, su probabilidad conjunta es el producto de las probabilidades individuales.

1.2.

C
alculo de probabilidades en espacios finitos: elementos de
an
alisis combinatorio

Consideremos el siguiente ejemplo. Se lanza una moneda perfecta tres veces. Cual es la probabilidad de obtener cara en dos de los tres lanzamientos? Un evento simple en este experimento
consiste en un conjunto ordenado de tres lementos binarios C o S (cara o seca), tal como CSS
(cara en la primera tirada y seca en las dos siguientes). Dado que la moneda es perfecta, podemos
asumir que los eventos simples son equiprobables. As, el primer paso para resolver el problema es
determinar el n
umero total de puntos muestrales (eventos simples) y el segundo paso determinar
el n
umero de puntos muestrales que contiene dos C. La manera mas simple es enumerar todos los
puntos muestrales:
CCC

CCS

CSC

SCC

CSS

SCS

SSC

SSS

15
Tenemos 8 puntos muestrales y por lo tanto la probabilidad de cada uno de ellos sera 1/8; de todos
los puntos muestrales en tres hay dos caras y por lo tanto la probabilidad buscada es 3/8.
Es evidente que esta tecnica tan simple solo es util cuando el n
umero posible de puntos muestrales es peque
no. En la mayora de los casos de interes, los espacios muestrales son enormes y
enumerar todos los puntos muestrales resulta imposible. Sin embargo, para calcular probabilidades
de eventos solo necesitamos contar cuantos puntos muestrales tenemos y para ello no es necesario
enumerarlos a todos. Esto se puede ver en el siguiente ejemplo.
Supongamos una reunion de 20 personas, en principio sin ninguna relacion directa entre ellos.
Cual es la probabilidad de que al menos 2 de ellas cumplan a
nos el mismo da?
Para empezar a resolver este problema, podemos en primer lugar invertir la pregunta. Si consideramos el evento todas las 20 personas cumplen a
nos en das diferenteses evidente que es el
complemento del evento al menos 2 de ellas cumplen a
nos el mismo da; si llamamos P1 y P2 a
las probabilidaes de ambos eventos tenemos que P1 + P2 = 1, o P2 = 1 P1 . Calculemos entonces
P1 (es mas facil que calcular directamente P2 ).
Supongamos que numeramos los das del a
no de 1 a 365 (ignoramos por simplicidad los a
nos
bisiestos). Un punto muestral de este experimento consiste en un conjunto de 20 n
umeros (cada uno
entre 1 y 365) donde el primero representa el cumplea
nos de la primera persona, el segundo n
umero
el de la segunda persona, etc.. El n
umero de puntos muestrales Ns sera entonces el n
umero de 20adas diferentes que podemos formar con 365 n
umeros. Para cada persona tenemos 365 posibilidades
diferentes. Dado que los n
umeros (fechas) pueden repetirse para diferentes personas Ns = 36520 .
Calculemos ahora el n
umero de puntos muestrales N1 en los cuales no se repite ning
un n
umero
entre los 20. Para la primera persona tenemos 365 posibilidades. Por cada una de ellas, tenemos
solo 364 para la segunda persona (todas los n
umeros posibles, menos el que se selecciono antes).
Para la tercera persona tenemos 363, etc. As
N1 = 365 364 363 346
As
P1 =

N1
365 364 363 346
=
0,59
Ns
36520

y por lo tanto P2 0,41. Existe un 41 % de probabilidad de que en cualquier reunion de 20 personas


al menos 2 cumplan a
nos el mismo da. En un grupo de 50 personas esta probabilidad asciende a
un 97 %.
Como ilustra el ejemplo anterior, al tratar con grandes cantidades de objetos a menudo tenemos
que calcular el numero de diferentes maneras de combinar los mismos. Este tipo de calculo entra
dentro del analisis combinatorio, del cual veremos algunas nociones basicas.
Una permutaci
on es cualquier arreglo de un conjunto de N objetos diferentes entre s en un
orden definido. Si queremos contar el n
umero total de posibles permutaciones de de N objetos, podemos pensar que tenemos N casilleros ordenados y distribumos los objetos uno en cada casillero.
Para el primer casillero tenemos N posibilidades. Por cada eleccion para el primer casillero procedemos a llenar los siguientes con los que quedan. As, para el segundo tenemos N 1 posibilidades
por cada una de las N del primero. A su vez, por cada una de las N 1 posibilidades del segundo
tenemos N 2 para el tercero y as sucesivamente. El n
umero total de posibles permutaciones de
N objetos es por lo tanto:
N (N 1) (N 2) 2 1 = N !
Supongamos ahora que queremos calcular el n
umero de permutaciones diferentes de R objetos
tomados entre un conjunto de N > R (como en el ejemplo de los cumplea
nos). Este n
umero se
N
denomina PR : permutaciones de N objetos tomados de a R. El procedimiento para obtener

16
PRN es semejante al anterior. En este caso, podemos pensar que tenemos R casilleros ordenados
y N objetos diferentes para llenarlos. Al igual que antes, tenemos N posibilidades para llenar el
primero, N 1 para el segundo y as hasta completar los R. Por lo tanto
PRN = N (N 1) (N 2) (N R + 1) =

N!
(N R)!

365 = 365!/(365 20)!.


As, en el ejemplo de los cumplea
nos N1 = P20

Una combinaci
on es una seleccion de R objetos tomados entre un conjunto de N , pero sin
importar el orden de los objetos. El n
umero de posibles combinaciones de N objetos tomados de
N a partir de P N . En P N cada selecci
N
on de un conjunto
a R se denota CR . Podemos obtener CR
R
R
particular de R objetos aparece repetida a traves de todas las permutaciones posibles de los mismos,
N y por lo tanto
esto es, R!. Tenemos entonces que PRN = R! CR

N
CR

N
R

PRN
N!
=
R!
R! (N R)!

N tambi
CR
en se suele llamar n
umero combinatorio o coeficiente binomial, ya que es el coeficiente
que aparece en el desarrollo del binomio de Newton:

(x + y)N =

N
X

xk y N k

k=0

N
k

(1.8)

Algunas propiedades inmediatas de los coeficientes binomiales son

N
0

N
1

N
N

=1

=N

En el ejemplo de las tres monedas, el n


umero de eventos con dos caras es C23 = 3.
El n
umero de permutaciones de N objetos, en los cuales hay n1 identicos (por lo tanto no
importa el orden) de un tipo, n2 de otro tipo, . . ., np elementos identicos del tipo p, viene dado por
el coeficiente multinomial:

N
n1 , . . . , np

N!
n1 ! . . . np !

dado que los mismo aparecen en la formula multinomial


N

(x1 + + xp )

X n n
=
x1 1 x2 2 xnp p

N
n1 , . . . , np

donde la suma comprende todos los valores de n1 , . . . , np entre cero y N , tal que

1.2.1.

Pp

i=1 ni

= N.

Ejercicios

1. Una baraja francesa consta de 52 cartas, dividida en cuatro grupos (palos) con 13 figuras
(n
umeros) cada grupo. En el juego de poker se reparten 5 cartas elegidas al azar.
a) Calcule la probabilidad de obtener un poker: cuatro cartas del mismo n
umero.

17
b) Calcule la probabilidad de obtener un full: tres cartas del mismo n
umero y las dos
restantes iguales a otro n
umero.
c) Calcule la probabilidad de obtener un par simple: dos cartas del mismo n
umero y las
tres restantes con n
umeros diferentes entre s y diferentes a los anteriores.
d ) Calcule la probabilidad de obtener un par doble: dos pares de cartas con n
umeros iguales
en cada par pero diferentes entre pares y una quinta diferente de los dos grupos anteriores.
2. Se arroja una moneda 3 veces. Sea Ei el evento sale cara en la tirada i-esima(i = 1, 2, 3).
Muestre que los tres eventos son independientes entre s.

Captulo 2

Variables aleatorias y probabilidad


Una variable cuyo valor esta determinado por la ocurrencia de una evento aleatorio se denomina
variable aleatoria o estoc
astica. En otras palabras, una variable aleatoria X es una funcion
del espacio muestral S en los n
umeros reales. En un dado experimento, una variable aleatoria
puede tomar diferentes valores. Debemos entonces tener cuidado en distinguir entre la variable
(que denotaremos con letras may
usculas) y sus posibles valores {xi } que puede tomar en cada
realizacion del experimento. Por ejemplo, el n
umero de caras que aparece en una tirada de tres
monedas es una variable aleatoria X, cuyos posibles valores son x = 0, 1, 2, 3.

2.1.

Variables aletorias discretas

Una variable aleatoria X que puede tomar un conjunto numerable (finito o infinito) de valores
X(S) = x1 , x2 , . . . se dice discreta. Se define la distribuci
on de probabilidad P (x) de una
variable aleatoria X como la probabilidad de que X tome el valor x, y viene dada por la suma de
las probabilidades de todos los puntos muestrales en S para los cuales X toma el valor x. La misma
satisface las propiedades
0 P (x) 1
X

P (x) = 1

Se define el valor esperado o valor medio de la variable x como


hxi

x P (x)

(2.1)

y el mismo representa un promedio pesado de la variable x. De la misma manera, se define el valor


medio de una funcion arbitraria de g(x) como
hg(x)i

g(x) P (x)

(2.2)

La variancia V (X) se define como


D

V (X) (x hxi)2 = x2 hxi2


p

(2.3)

y el desvo est
andar como X = V (X). El valor medio nos da una medida del promedio
esperable de los valores de X si el experimento se repite muchas veces. El desvo estandar nos da
una medida de cuan dispersos estaran estos resultados respecto del valor medio. Desarrollaremos
estos conceptos con mayor detalle mas adelante.
19

20
El momento n-esimo de una variable X se define como
hxn i

xn P (x)

(2.4)

Veremos a continuacion algunos ejemplos de distribuciones de probabilidad que aparecen con


frecuencia en la practica.

2.1.1.

La distribuci
on de probabilidad binomial

Una de las aplicaciones mas comunes de la Teora de Probabilidades es el caso de un n


umero
n muy grande de experimentos, cada uno de los cuales tiene solo dos posibles resultados. Un
ejemplo tpico es una encuesta de opinion acerca de una votaci
on por un plesbicito (votaci
on por
SI o por NO, donde el voto en blanco no esta permitido). La empresa encuestadora selecciona
una muestra, esto es un subconjunto, de n personas dentro de un espacio muestral enorme con
N n elementos. Si bien cada persona tiene perfectamente definido su voto, lo encuestados son
elegidos completamente al azar. Supongamos entonces que una fraccion p de los votantes votar
a por
SI. Dado que solo hay dos posibilidades, una fraccion 1 p votar
a por NO. Si se elige entonces
una persona al azar, la probabilidad de que vote por SI sera justamente p (Ec.(1.3)). La pregunta
entonces es: Cual es la probabilidad de que exactamente x entre los n voten por SI?
Un experimento binomial tiene entonces las siguientes caractersticas:
1. El experimento consta de n pruebas identicas.
2. Cada prueba tiene dos resultados posibles. Llamaremos genericamente exito E y fracaso F .
3. La probabilidad de tener exito en una sola prueba es p y permanece constante de prueba en
prueba (la probabilidad de fracaso por lo tanto es (1 p)).
4. Las pruebas son independientes entre s.
5. La variable de estudio es X, el n
umero de exitos observados en las n pruebas.
Otro ejemplo de un experimento binomial sera arrojar n monedas perfectas y contar el n
umero
de veces que aparece cara. En este caso p = 1/2.
Los puntos muestrales de este experimento consisten en cadenas binarias del tipo
EEEEEEF F . . . F EEF
Supongamos una cadena particular conteniendo x valores E y n x valores F y calculemos
su probabilidad. Este evento es la intersecci
on de n eventos independientes, de los cuales x tienen
probabilidad p y n x tienen probabilidad 1 p. Por lo tanto, la probabilidad de la interseccion es
px (1 p)nx . Ahora bien, esa es la probabilidad de un conjunto particular conteniendo x valores
E y n x valores F en un determinado orden. Si cambiamos el orden de las letras, sin alterar
la cantidad de letras E y F , obtenemos otro conjunto diferente con la misma probabilidad. Dado
que dichos eventos son mutuamente excluyentes, la probabilidad de la union es la suma de las
probabilidades. La probabilidad de obtener x valores E y n x valores F , sin importar el orden (es
lo que buscamos) sera entonces px (1 p)nx multiplicado por el n
umero de combinaciones posibles
de dichas letras, esto es, Cxn . As

nx

P (x) = p (1 p)

n
x

para

x = 0, 1, . . . , n

(2.5)
P

Esta es la distribuci
on binomial. Podemos verificar que la misma esta normalizada (
1):

x P (x)

21

n
X

P (x) =

x=0

n
X

px (1 p)nx

x=0

n
x

= [p + (1 p)]n = 1

donde hemos usado el binomio de Newton Ec.(1.8). Podemos calcular tambien el valor medio de
X:

n
X

hxi = =

x px (1 p)nx

x=0

n
X

px (1 p)nx

x=1

= np
= np

n
X
x=1
n1
X

= np

n!
(n x)! (x 1)!

px1 (1 p)nx

(n 1)!
(n x)! (x 1)!

py (1 p)ny1

(n 1)!
(n 1 y)! y!

y=0
n1
X

n
x

n1y

p (1 p)

y=0

n1
y

= np

(2.6)

En forma semejante se puede demostrar que (Ej. 2.1.4-1)


V (X) = np (1 p) .

2.1.2.

(2.7)

La distribuci
on de probabilidad geom
etrica

Supongamos ahora que realizamos una experimento semejante al binomial, pero en lugar de
realizar n pruebas, terminamos el experimento cuando aparece por primer vez una E. La variable
aleatoria que nos interesa aqu es el n
umero X de la prueba para la cual se obtuvo el primer exito.
La aparicion del primer exito puede tener lugar en la primera prueba, en la segunda o nunca. As,
la variable X en este caso no esta acotada. Los elementos del espacio muestral en este caso son:
E1 = E (exito en la primera prueba), E2 = F E (exito en la segunda), ,Ek = F F F E (exito
en la k-esima), etc. Dado que las pruebas son independientes, la probabilidad es
P (x) = (1 p)x1 p

para

x = 1, 2, . . . ,

(2.8)

Esta se conoce como distribuci


on geom
etrica. Dado que (1 p) 1, vemos que la distribucion
geometrica decae exponencialmente con x, a menos que p = 1, en cuyo caso P (1) = 1 y P (x) = 0
en cualquier otro caso. Verifiquemos la normalizacion:

X
x=1

P (x) =

p (1 p)x1 =

x=1

p X
1
p
1 =1
(1 p)x =
1 p x=1
1 p [1 (1 p)]

donde hemos usado la suma de la serie geometrica


(q 1 p):
hxi = p

X
x=1

xq

x1

d
=p
dq

X
x=1

x
x=0 a

= 1/(1 a). Veamos el valor medio

d
=p
dq

q
1q

1
.
p

(2.9)

22
Este resultado es facil de interpretar. Cuanto menor sea el valor de p, mas lentamente decae P (x)
y por lo tanto mayor es el valor medio. En forma semejante, puede demostrarse que (Ej. 2.1.4-1)
V (X) =

2.1.3.

2
1
.
2
p
p

(2.10)

La distribuci
on de Poisson

Supongamos que tenemos una sustancia radioactiva y un contador Geiger. La sustancia emite
una partcula aleatoriamente en el tiempo cada vez que un atomo decae y marca un conteo en el
Geiger. Supongamos que el tiempo de vida media de la sustancia es muy grande comparado con el
tiempo de observacion, de manera que el n
umero de conteos es relativamente peque
no (no estamos
pensando en una reaccion en cadena). Cada evento de decaimiento entonces puede considerarse
independiente de los otros. Nos interesa entonces determinar la probabilidad de observar X conteos
en un intervalo de tiempo dado . Podemos llevar a cabo este calculo subdividiendo el intervalo de
tiempo en n subintervalos, de tal manera que /n sea suficientemente peque
no para que la probabilidad de que ocurra mas de un decamiento en un subintervalo sea despreciable. Sea p la probabilidad
de que ocurra un conteo en un subintervalo. Claramente, p y los resultados subsecuentes van a depender de n. Ahora bien, la manera de independizarnos de la longitud del subintervalo es tomar el
lmite en que este va a cero. Si bien p depende de la longitud del subintervalo, podemos asumir que
es la misma para cualquiera de ellos (para una longitud dada). En ese caso, la distribucion de
probabilidad para X es binomial. Si bien no sabemos en principio como depende p de la longitud
del subintervalo, parece razonable que p disminuya a medida que la misma disminuye, es decir,
que n aumenta. La dependencia mas simple que satisface estos criterios es p = /n, donde es
una constante. En otras palabras, vamos a asumir que el valor medio de conteos p n se mantiene
constante a medida que aumentamos n. La distribucion de probabilidad para X se obtiene entonces
tomando el lmite n de la distribucion binomial con p = /n:

nx

lm p (1 p)

n
x

n (n 1) (n x + 1)
= lm
n
x!

=
=

x
lm 1
x! n

x
lm 1
x! n

n
1
n

n
1
n

1
n

nx

x n (n 1) (n x + 1)
n
nx
x

1
x1
1
1
n
n
n

Todos los factores a la derecha tienden a uno, mientras que

lm

= e

As
x
e
(2.11)
x!
Esta se conoce como distribuci
on de Poisson. Esta distribucion se aplica en general cada vez
que tenemos un proceso que ocurre aleatoriamente en un intervalo de tiempo o espacio, cuando
la probabilidad de ocurrencia de un evento es constante e independiente de los demas eventos.
Algunos otros ejemplos de aplicacion son el n
umero de autos que pasan a traves de un cierto punto
en una ruta durante un periodo definido de tiempo, el n
umero de llamadas telefonicas en una central
telefonica por minuto, el n
umero de animales muertos encontrados por unidad de longitud de ruta,
etc. La distribucion fue descubierta por Simeon-Denis Poisson (1781-1840) quien la publico, junto
P (x) =

23

Figura 2.1: Distribucion de Poisson para diferentes valores del valor medio .

con su teora de probabilidad, en 1838 en su trabajo Recherches sur la probabilite des jugements en
mati`eres criminelles et mati`ere civile (Investigaci
on sobre la probabilidad de los juicios en materias
criminales y civiles).
Verifiquemos la normalizacion:

X
x=0

P (x) = e

X
x
x=0

x!

= e e = 1

y el valor medio
hxi = e

X
x=0

X
X
x
x
x1
= e
= e
=
x!
(x 1)!
(x 1)!
x=1
x=1

(2.12)

De la misma manera se puede demostrar que (Ej. 2.1.4-1)


V (X) = .

(2.13)

En la Fig.2.11 se muestran algunos ejemplos de la distribucion de Poisson para diferentes valores


de .

2.1.4.

Ejercicios

1. Demuestre las ecuaciones (2.7), (2.10) y (2.13)

2.2.

Variables aleatorias contnuas

Una variable aleatoria X que puede tomar un conjunto nonumerable de valores en un dado
intervalo del eje real se dice contnua. Un intervalo (a, b) contenido en el dominio de definicion de la

24
variable corresponde entonces a un evento. Vamos a introducir entonces una densidad de probabilidad fX (x), tal que la probabilidad de que X tome valores dentro del intervalo comprendido
entre x y x + dx esta dada por fX (x) dx. La probabilidad de que X tome valores en un intervalo
finito (a, b) viene entonces dada por
P (a X b) =

Z b
a

fX (x) dx

La densidad de probabilidad debe ser contnua a tramos, satisfacer fX (x) 0 y


Z

fX (x) dx = 1

Notemos que, de acuerdo con esta definicion, la probabilidad de que una variable contnua tome
un valor bien definido P (X = x) = 0.
Podemos englobar tambien dentro de esta definicion a las variables aleatorias discretas. Si X es
una variable aleatoria discreta que toma valores x1 , x2 , . . ., con probabilidad pi = P (xi ), entonces
su dendsidad de probabilidad sera
fX (x) =

pi (x xi )

donde (x) es la funcion delta de Dirac.


Se define la Funci
on de distribuci
on FX (x) (no hay que confundirla con la distribucion de
probabilidad de una variable discreta) como la probabilidad P (X x):
FX (x) = P (X x) =

Z x

fX (x0 ) dx0

Se sigue entonces que fX (x) = dFX (x)/dx. Dado que fX es nonegativa, la funcion de distribucion
es siempre nodecreciente. Por la normalizacion de fX , la funcion de distribucion toma los valores
lmite FX () = 0 y FX () = 1. Para el caso de una variable aleatoria discreta tendremos que
FX (x) =

pi (x xi )

donde (x) es la funcion escalon de Heaviside, esto es, (x) = 0 para x 0 y (x) = 1 para x > 0.
El momento n-esimo de la variable X se define entonces como
n

hx i

xn fX (x) dx

Veamos un poco la interpretacion de estas cantidades. Todas las propiedades de la variable X


estan contenidas en la funcion densidad (algo as como una relacion fundamentalpara la variable).
La probabilidad de que X tome valores en un dado intervalo esta dada por el area bajo fX para
ese intervalo.
El primer momento hxi (media o valor medio) nos da el centro de masade la densidad fX .
Esta cantidad a menudo se confunde con otras dos cantidades: el valor mas probable xp y la
mediana xm . El valor mas probable de X se define como el maximo de fX . La mediana se define
como el valor de x que divide el area bajo la curva fX (X) en partes iguales. En otras palabras,
FX (xm ) = 1/2. En algunos casos estas cantidades coinciden (como veremos mas adelante) pero en
general son diferentes.
El segundo momento q
x2 nos da el momento de inerciade la densidad fX respecto del orgen.
El desvo estandar X = hx2 i hxi2 nos da una medida de cuan lejos se dispersa la probabilidad
respecto de la media hxi, esto es, el desvo medio cuadratico.

25
Supongamos una variable tal que hxi = 0 (siempre podemos hacer que
esto ocurra desplazando
3
el orgen, esto es, restando la media de la variable). El tercer momento x nos da una medida de
cuan asimetrica es la distribucion respecto del orgen. Esto es, si la densidad es simetrica respecto
del orgen, es una funcion par y por lo tanto el tercer momento se anula. Cuanto mayor sea el tercer
momento, menos simetricasera fX .
Veamos algunos ejemplos. Un variable tiene distribucion uniforme si
(

fX (x) =

A
si
axb
0 en otro caso

(2.14)

donde A es una constante. La normalizacion exige que A = 1/(b a). La probabilidad de que X
tome valores en un intervalo (c, d), con a < c < d < b resulta (d c)/(b a). Un calculo directo
muestra que hxi =(b + a)/2, esto es, el centro del intervalo. De la misma forma es facil mostrar
que X = (b a)/ 12. Un calculo directo nos muestra que la probabilidad de que
P (hxi X x hxi + X ) 0,58
.
Esto es, el intervalo X alrededor de la media concentra aproximadamente el 60 % de la probabilidad. La funcion de distribucion se obtiene tambien facilmente:

FX (x) =

0
si
x<a
A (x a) si a x b

1
si
x>b

(2.15)

De aqui puede verificarse inmediatamente que xm = hxi.

2.2.1.

Distribuci
on de Gauss

Otro ejemplo de gran importancia es la distribuci


on de Gauss o normal, definida por:
fX (x) =

1
2
2

e(x) /2
2

(2.16)

definida para todo x real, con > 0. El lector puede verificar por integraci
on directa que la misma
esta normalizada y que hxi = , X = . Esta curva tiene su maximo en x = y es simetrica
respecto del valor medio. Por lo tanto en este caso la media, la mediana y el valor mas probable
coinciden. Mediante integracion numerica (o mediante valores de tablas), puede verificarse que la
probabilidad de que la variable tome valores en un intervalo alrededor de la media es aproximadamente 68 %, mientras que para un intervalo 2 la probabilidad es de aproximadamente
95 %.

2.2.2.

Distribuci
on exponencial

Un ejemplo de una distribucion no simetrica es la distribuci


on exponencial
(

fX (x) =

0
1

ex/

si x < 0
si x 0

(2.17)

El lector puede verificar por integraci


on directa que la misma esta normalizada y que hxi = ,
X = . Esta curva tiene su maximo en x = 0. Por otra parte, la funcion de distribucion es
(

FX (x) =

0
si x < 0
x/
1e
si x 0

(2.18)

26

Figura 2.2: Distribucion exponencial, media, mediana y valor mas probable.

Si resolvemos la ecuacion F (xm ) = 1/2, obtenemos xm = ln 2. Vemos que en este caso la media,
la mediana y el valor mas probable no coinciden. Los mismos se muestran el la Fig.2.2 junto con
la densidad.

2.2.3.

Transformaci
on de variables aleatorias

Sea Y = g(X), donde g(x) es una funcion arbitraria y X una variable aleatoria. Siendo X
aleatoria, Y tambien lo es. Supongamos que conocemos la densidad de probabilidad fX (x). Nos
preguntamos entonces cual es la densidad de probabilidad fY (y). Para relacionar ambas cantidades
notemos que
hyi =

g(x) fX (x) dx =

y fY (y) dy

(2.19)

Resulta inmediato verificar que


fY (y) =

(y g(x)) fX (x) dx

(2.20)

satisface la condicion anterior. Usando la propiedad de la delta de Dirac:


(h(z)) =

X
i

1
(z zi )
|h0 (zi )|

si h0 (zi ) 6= 0, donde zi son los ceros de h(z), resulta

X dg 1 (y)
fY (y) =
i
f [g 1 (y)]
dy X i

(2.21)

donde gi1 (y) son las diferentes ramas de la funcion inversa de g(x) (estamos suponiendo el caso general en que la funcion g(x) no tiene una inversa u
nica). La Ec.(2.21) puede interpretarse
facilmente. Supongamos primero que la funcion g(x) tiene inversa u
nica. Entonces

dx(y)
fX [x(y)]

fY (y) =
dy

27
Si g(x) es creciente (g 0 (x) > 0) y por lo tanto dx(y)/dy > 0) entonces
fY (y) dy = fX (x) dx
Esta ecuacion nos dice que la probabilidad de que Y tome valores entre y e y + dy es igual a la
probabilidad de que X tome valores entre x y x + dx, donde dy = g 0 (x) dx. Si g(x) es decreciente,
su derivada es negativa y por lo tanto
fY (y) dy = fX (x) dx
ya que fY (y) debe ser positiva. Si la funcion g 1 (y) es multivaluada, entonces podemos repetir las
consideraciones anteriores, pero para evaluar la probabilidad de que Y tome valores entre y e y +dy,
debemos sumar las probabilidades de todas las ramas de g 1 (y) correspondientes al intervalo de X
entre x y x + dx.

2.2.4.

Funci
on caracterstica y desarrollo en cumulantes

La funcion caracterstica fX (k) correspondiente a una variable aleatoria X se define como


D

fX (k) = eikx =

eikx fX (x) dx

(2.22)

esto es, la transformada de Fourier de fX (x). Desarrollando en serie de Taylor la exponencial e


integrando termino a termino tenemos:
fX (k) =

X
(ik)n hxn i

n!

n=0

(2.23)

Es importante notar que el desarrollo anterior solo es valido si los momentos decrecen suficientemente rapido con n como para que la serie converja; en otras palabras, el intercambio entre la serie
y la integracion no siempre es valido. En el caso en que este desarrollo sea valido, vemos que si
tenemos todos los momentos podemos reconstruir la densidad de probabilidad fX (x) antitransformando
1
fX (x) =
2

eikx fX (k) dk

(2.24)

fX (k) es una funcion contnua de k, compleja con las propiedades fX (k = 0) = 1, |fX (k)| 1 y

fX (k) = fX (k) ( denota complejo conjugado). Si conocemos la funcion caracterstica, podemos


obtener los momentos por diferenciacion:
hxn i = lm (i)n
k0

dn fX (k)
dk n

Tomemos por ejemplo la distribucion de Gauss Ec.(2.16). De la definicion (2.22) completando


cuadrados en el exponente es facil ver que
2 2
fX (k) = eikk /2

Derivando una vez obtenemos:


hxi = lm (i) (i k 2 ) fX (k) =
k0

Derivando dos veces obtenemos:


D

x2 = lm (i)2 [ 2 + (i k 2 )2 ] fX (k) = 2 + 2
k0

(2.25)

28
Alternativamente al desarrollo en potencias de la funcion caracterstica, podemos desarrollar en
potencias el logaritmo de la misma. esto es
ln fX (k) =

X
(ik)n
n=1

n!

Cn (X)

(2.26)

Esto se conoce como desarrollo en cumulantes, donde el coeficiente de la potencia n-esima


Cn (X) se conoce como cumulante de orden n. De la definicion, tenemos que
fX (k) = exp

"
X (ik)n
n=1

n!

Cn (X)

(2.27)

Usando el sarrollo en serie de Taylor de la exponencial en la Ec.(2.27) y el desarrollo (2.23) e


igualando potencias de k, podemos expresar los cumulantes en terminos de los momentos. As, por
ejemplo:
C1 (X) = hxi
D

C2 (X) =
C3 (X) =

x2 hxi2 = V (X)
E

x3 3 hxi x2 + 2 hxi3

y en general puede verse que el cumulante de orden n es funcion de todos lo momentos de orden
l n. Si comparamos la funcion caracterstica (2.25) para la distribucion de Gauss con la expresion
(2.27) vemos que para la misma se anulan todos los cumulantes de orden n > 2. Esto significa que
todos los momentos de orden superior a 2 pueden ser expresados en funcion de los dos primeros
momentos. Esto es un particularidad de la distribucion de Gauss.

Captulo 3

Distribuciones de probabilidad
multivariadas
Sobre un dado espacio muestral podemos definir diferentes variables aleatorias. Por ejemplo,
en un experimento binomial, X1 podra ser la variable binomial (n
umero de total de exitos) y X2
el n
umero de exitos en las k primeras pruebas. Si las variables aleatorias X1 , X2 , . . . , Xn estan
definidas sobre el mismo espacio muestral S se dice que estan conjuntamente distribuidas.

3.1.

Distribuci
on de probabilidad conjunta

La funcion de distribucion conjunta para las variables aleatorias X1 , X2 , . . . , Xn se define como


FX1 ,...,Xn (x1 , . . . , xn ) Prob {X1 < x1 , . . . , Xn < xn }

(3.1)

donde {X1 < x1 , . . . , Xn < xn } = {X1 < x1 } {X1 < x2 } . . . {Xn < xn }. En otras palabras,
FX1 ,...,Xn (x1 , . . . , xn ) es la probabilidad de que las variables aleatorias Xi tomen simultaneamente
valores en los intervalos { < Xi < xi } con i = 1, . . . , n. La densidad de probabilidad conjunta fX1 ,...,Xn (x1 , . . . , xn ) se define entonces como
fX1 ,...,Xn (x1 , . . . , xn ) =

n FX1 ,...,Xn (x1 , . . . , xn )


x1 . . . xn

(3.2)

de tal manera que


FX1 ,...,Xn (x1 , . . . , xn ) =

Z x1

Z xn

dx01 . . . dx0n fX1 ,...,Xn (x01 , . . . , x0n )

(3.3)

Consideremos por simplicidad de aqui en mas solo dos variables aleatorias X e Y , con funciones
de distribucion y densidad FX,Y (x, y) y fX,Y (x, y) respectivamente. La funcion de distribucion
satisface FX,Y (, y) = FX,Y (x, ) = FX,Y (, ) = 0 y FX,Y (, ) = 1. Ademas:
FX,Y (x2 , y) FX,Y (x1 , y) = Prob {x1 < X1 < x2 ; Y < y}
La densidad de probabilidad fX,Y (x, y) satisface las condiciones fX,Y (x, y) 0 y
Z

dx

dy fX,Y (x, y) = 1

(3.4)

Dadas dos variables X e Y distribuidas conjuntamente, la funcion de distribucion reducida o


marginal FX (x) para la variable X viene dada por
FX (x) = FX,Y (x, ) =

Z x

29

dx0

dy fX,Y (x0 , y)

(3.5)

30
Y de la misma manera, la densidad de probabilidad marginal fX (x) para la variable X se define
como
fX (x) =

dy fX,Y (x, y)

(3.6)

Las funciones de distribucion y marginal para la variable Y se obtienen de manera semejante.


El momento n-esimo de la variable X se define como
hxn i =

dx

dy xn fX,Y (x, y) =

xn fX (x) dx

Los momentos conjuntos para las variables X e Y se definen como


n m

hx y i =

dx

dy xn y m fX,Y (x, y)

(3.7)

El momento conjunto mas comunmente utilizado en fsica es la covariancia


Cov(X, Y ) = h(x hxi)(y hyi)i = hxyi hxi hyi

(3.8)

que nos da una medida de la correlacion entre fluctuaciones de ambas variables. Altermativamente,
suele usarse la funci
on de correlaci
on (tambien llamada coeficiente de Pearson):
Cor(X, Y ) =

Cov(X, Y )
X Y

(3.9)

la cual es adimensional. La funcion de correlacion satisface las siguientes propiedades (facilmente


demostrables):
Cor(X, Y ) = Cor(Y, X)
1 Cor(X, Y ) 1
Cor(X, X) = 1, Cor(X, X) = 1
Cor(aX + b, cY + d) = Cor(X, Y ) si a, c 6= 0
Dos variables aleatorias X e Y son independientes si
fX,Y (x, y) = fX (x) fY (y) x, y
Si X e Y son independientes se satisfacen las siguientes propiedades
hxm y n i = hxm i hy n i
Cor(X, Y ) = 0
V (X + Y ) = V (X) + V (Y )
Esta u
ltima propiedad se generaliza directamente al caso de n variables X1 , . . . , Xn todas independientes entre s:
V

n
X
i=1

Xi

n
X

V (Xi )

(3.10)

i=1

Al tratar con muchas variables aleatorias, a menudo necesitamos encontrar la densidad de


probabilidad de una nueva variable que es funcion de las anteriores. Por ejemplo, supongamos que
conocemos la densidad conjunta fX,Y (x, y) y queremos obtener la densidad de probabilidad de la

31
variable Z = G(X, Y ), donde G es una funcion conocida de dos variables. En una generalizacion
de la Ec.(2.20), tenemos que
fZ (Z) =

dx

dy (z G(x, y)) fX,Y (x, y)

(3.11)

esta expresion se generaliza facilmente al caso de n variables.


Tomemos un ejemplo. Sean X e Y dos variables aleatorias independientes, con distribuciones
gaussianas de media nula y variancia unitaria, esto es

fX (x) =
fY (y) =

1
2
ex /2
2
1
2
ey /2
2

Supongamos que queremos conocer la densidad conjunta de las variables


V

= X +Y

= X Y

(3.12)

Tenemos que
1
fV,W (v, w) =
2

dx

2 +y 2 )/2

dy v v 0 (x, y) w w0 (x, y) e(x

donde v 0 (x, y) = x + y y w0 (x, y) = x y. Cambiando las variables de integraci


on a v 0 , w0 :
1
fV,W (v, w) =
2

dv

dw J

x y
v 0 w0

v v 0 w w0 ) e(w

02 +y 02 )/4

donde hemos usado que x2 + y 2 = (w02 + v 02 )/2 y

x y
v 0 w0

1
2

es el Jacobiano de la transformacion (3.12). As,


fV,W (v, w) =

1 (w2 +v2 )/4


e
4

Dado que fV,W (v, w) es factorizable, las variables V y W son independientes.


De la Ec.(3.11) la funcion caracterstica para una variable Z = G(X, Y ) resulta
fZ (k) =

dx

dy eikG(x,y) fX,Y (x, y)

3.2.

Distribuciones binomiales

3.2.1.

Derivaci
on mediante la funci
on caracterstica

(3.13)

Resulta instructivo derivar nuevamente la distribucion binomial a partir de los conceptos que
hemos visto en esta seccion. En un experimento binomial podemos describir el resultado de cada
prueba individual mediante una variable aleatoria Xi , donde el ndice i corresponde al n
umero de la

32
prueba. La variable Xi puede tomar los valores x = 1 con probabilidad p y x = 0 con probabilidad
1 p. La densidad de probabilidad para esta variable es
fXi (x) = p (x 1) + (1 p) (x)

(3.14)

y su funcion caracterstica resulta


fXi (k) = (1 p) + p eik

(3.15)

Dado que todas las pruebas son independientes, la densidad de probabilidad conjunta para las
variables correspondientes a las n pruebas es
fX1 ,...,Xn (x1 , . . . , xn ) = fX1 (x1 ) fXn (xn )
La variable binomial (n
umero de exitos en las n pruebas) puede expresarse como Yn =
De la Ec.(3.13), la funcion caracterstica para la variable Yn resulta
fYn (k) =

dx1

Pn

i=1 Xi .

dxn eik(x1 ++xn ) fX1 (x1 ) fXn (xn )

= fX1 (k) fXn (k) = q + p eik

(3.16)

donde q = 1 p. Expandiendo el binomio tenemos


fYn (k) =

n
X

l=0

n
l

pl q nl eikl

(3.17)

de donde la densidad de probabilidad para la variable Yn resulta


1
fYn (y) =
2

dk e

iky

fYn (k) =

n
X

l=0

n
l

pl q nl (y l)

(3.18)

que es equivalente a la expression (2.5).

3.2.2.

Lmite n

En muchas aplicaciones vamos a trabajar con distribuciones binomiales con n muy grande.
Queremos entonces obtener el comportamiento asint
otico de la distribucion binomial cuando n
. Tanto el valor medio cono la variancia divergen en este caso. As, resulta practico trabajar con
la variable aleatoria normalizada
Zn =

Yn hyn i
Yn pn
=
Yn
pq n

(3.19)

La densidad de probabilidad para la variable Zn es


Z

y pn
fZn (z) =
dy z
pq n

fYn (y)

y la funcion caracterstica
Z

y pn
fZn (k) =
dz e fZn (z) =
dy exp ik
fYn (y)
pq n

!
n

k
ik p/qn
ik q/pn
ik pn/q
fYn
= qe
+ pe
= e
pq n
ikz

(3.20)

33
donde hemos usado la Ec.(3.16) y que q = 1 p. A continuaci
on desarrollamos la cantidad entre
parentesis en potencias de k. Es facil ver que los dos primeros terminos no nulos son 1 k 2 /2n.
As, podemos expresar

!n

k2
fZn (k) = 1
(1 + Rn )
2n

(3.21)

donde
Rn = 2

X
1
ik m2 pq m + q(p)m
m=3

m!

(pq)m/2

Para n tenemos que Rn 0. Sea Z = lmn Zn . Entonces

fZ (k) lm fZn (k) = lm


n

k2
1
2n

!n

= ek

2 /2

(3.22)

As, en el lmite n obtenemos


1
fZ (z) =
2

dk eikz ek

2 /2

1
2
= ez /2
2

(3.23)

La variable Z tiene una distribucion gaussiana con media


Z = 1. Para el caso n
nula y variancia
2
1, pero finito, a
un podemos aproximar fZn (z) (1 2) exp(z /2). Transformando nuevamente
a la variable y = Y z + hyi tenemos finalmente

1
(y hyi)2

fYn (y)
dz (y Y z + hyi) fZ (z) =
exp
2Y2
Y 2

3.2.3.

(3.24)

Caminata aleatoria

El problema de la caminata aleatoria es un ejemplo de un problema binomial en fsica. Este


es un modelo simplificado para el movimiento Browniano, esto es, el movimiento de una partcula
bajo la accion de fuerzas aleatorias sin correlacion entre s y constituye la explicacion mas basica
del fenomeno de difusion. Veremos el caso mas simple de una caminata unidimensional.
Consideremos el caso de una partcula restringida a moverse a lo largo del eje x. A cada intervalo
de tiempo la partcula tiene una probabilidad p = 1/2 de dar un paso de longitud hacia la
derecha y una probabilidad q = 1/2 de dar un paso equivalente hacia la izquierda. Supongamos que
la partcula ha dado N pasos y que los pasos son estadsticamente independientes (la probabilidad de
un paso a la derecha o a la izquierda a cada instante es independiente de todos los anteriores). El paso
i-esimo tiene entonces asociada una variable Xi que toma los valores x = con probabilidades
p = q = 1/2 y por lo tanto su densidad de probabilidad es
fXi (x) =

1
((x ) + (x + ))
2

y la funcion caracterstica resulta fXi (k) = cos(k).


P
El desplazamiento neto YN de la partcula al cabo de N pasos esta dado por YN = N
i=1 Xi ,
suponiendo que la partcula parte del orgen. De la Ec.(3.16) tenemos que la funcion caracterstica
para la variable YN es
fYN (k) = (cos(k))N

(3.25)

Vamos a analizar ahora el lmite cuando tanto el desplazamiento neto en un paso como el
tiempo entre pasos se vuelven infinitesimalmente peque
nos. En dicho lmite tanto YN como el

34

Figura 3.1: Densidad de probabilidad para la caminata aleatoria unidimensional con D = 1/2.

tiempo transcurrido t = N pueden aproximarse por variables contnuas. Podemos escribir entonces
fYN (k) = fY (k, t). Dado que la partcula parte del orgen (y = 0), tenemos que fY (y, t = 0) = (y)
y por lo tanto fY (k, 0) = 1. De la Ec.(3.25) podemos escribir

k 2 2
fY (k, t + ) fY (k, t) = (cos(k) 1) fY (k, t) =
+
2

fY (k, t)

(3.26)

Si tomamos el lmite para N y 0 manteniendo t = N constante, tenemos


fY (k, t + ) fY (k, t)
fY (k, t)
=
N 0

t
lm lm

(3.27)

De la Ec.(3.26) tenemos entonces


1
fY (k, t)
= lm lm lm =
N 0 0
t

k 2 2

+
2

fY (k, t)

(3.28)

La u
nica manera de que este lmite sea finito (y distinto de cero) es que
2
=D<
0 0
lm lm

en cuyo caso obtenemos la ecuacion diferencial


fY (k, t)
= D k 2 fY (k, t),
t
cuya solucion con la condicion inicial fY (k, 0) = 1 es

(3.29)

2
fY (k, t) = eDk t

(3.30)

La densidad de probabilidad es
1
fY (y, t) =
2

iky Dk2 t

1
y2
exp
4 Dt
4Dt

(3.31)

35
As, la probabilidad de encontrar al caminante
en una posicion entre y e y + dy es gaussiana con

media nula y desviacion estandar = 2Dt. La densidad de probabilidad se desparramaen


el
p
tiempo manteniendo el area unitaria, como se muestra en la Fig.3.1. Notemos que hy 2 i = t.
Este es el comportamiento caracterstico de un movimiento
difusivo: el desplazamiento de una

partcula browniana de su posicion inicial crece com t. La constante D se conoce como coeficiente
de difusi
on. De hecho, notemos que de la definicion
fY (y, t) =

1
2

eiky fY (k, t)

tenemos que
fY (y, t)
1
=
t
2

eiky

fY (k, t)
t

y
2 fY (y, t)
1
=
2
y
2

(k 2 ) eiky fY (k, t)

As, antitransformando la Ec.(3.29) obtenemos


2 fY (y, t)
fY (k, t)
=D
t
y 2

(3.32)

Esta u
ltima ecuacion diferencial se conoce como ecuaci
on de difusi
on (tiene la misma estructura que la ecuacion de difusion de calor) y su solucion viene dada por la Ec.(3.31).

3.3.

El Teorema del Lmite Central

Consideremos un conjunto de N variables aleatorias Xi , todas independientes entre s e identicamente distribuidas, esto es, la densidad de probabilidad fX (x) es la misma para todas. Un ejemplo
de esto podra ser la repeticion independiente de un mismo experimento N veces. Sean = hxi y
2 = V (X) el valor medio y la variancia correspondientes a la densidad fX (x).
Consideremos ahora la variable YN , definida como la desviacion del promedio aritm
etico de
las N variables respecto de , esto es
YN

N
N
X
1 X
Xi =
Zi
N i=1
i=1

(3.33)

donde
1
(xi )
N
donde hZi i = 0 y V (Zi ) = 2 /N 2 . Resulta inmediato que
Zi

*N
X

(3.34)

Xi

= N

i=1

con lo cual
hYN i = 0

(3.35)

Pensemos en que queremos medir una cierta cantidad, la cual fluctua de experimento en experimento
(Xi ). Habitualmente queremos estimar el valor medio de esta variable (), para lo cual repetimos

36
el experimento N veces y aproximamos por el promedio aritmetico de las N mediciones. Sin
embargo, ese promedio es a su vez una variable aleatoria (si repetimos la serie de N experimentos,
el nuevo promedio tambien fluctua). La Ec.(3.35) nos dice que el valor medio de este promedio
coincide con , con lo es en principio un estimador aceptable. Sin embargo, querramos evaluar de
alguna manera el error cometido en esta estimacion. Para eso tenemos que analizar las fluctuaciones
del promedio aritmetico respecto de su valor medio, las cuales estan descriptas por la variable YN . Si
recordamos la ecuacion (3.10), vemos que, bajo el supuesto de que las mediciones son completamente
independientes entre s, tenemos que
V (YN ) =

N
X

V (Zi ) =

i=1

2
N

(3.36)

con lo cual YN = / N . Podemos concluir a partir de este resultado que la dispersion del promedio disminuye con N ? Estrictamente no, ya que podria ocurrir que momentos de orden superior
al segundo se hagan muy grandes. Para dar una respuesta a la pregunta anterior debemos obtener la distribucion de probabilidad para la variable YN . Para ello calculamos primero la funcion
caracterstica para las variables Zi . Tenemos que
fZ (k) =

dx ei(k/N )(x) fX (x) = 1

1 k2 2
+
2 N2

(3.37)

donde hemos desarrollado en serie de Taylor la exponencial e integrado termino a termino. Si este
desarrollo es valido, es decir, si los momentos de fX (x) son finitos, los termino superiores pueden
despreciarse para N suficientemente grande (notemos que el caracter oscilatorio del integrando
asegura que la integral se va a cero para valores grandes de k). La funcion caracterstica para YN
es por lo tanto

fYN (k) =

!N

1 k2 2
1
+
2 N2

k2 2
exp
2N

para N

(3.38)

y la densidad de la variable YN :
1
fYN (x)
2

k2 2
dk eiky exp
2N

N
N y2
exp

2 2
2 2

(3.39)

Independientemente de la forma particular de fX (x), si sus momentos son finitos, el promedio


de un n
umero grande de mediciones de X tiene una
distribucion gaussiana centrada en hxi y con
desvo estandar igual al devo de X dividido por N . Este el el Teorema del Lmite Central.

Captulo 4

Fundamentos de la Mec
anica
Estadstica
4.1.

Introducci
on: Relaci
on entre la descripciones microsc
opica y
macrosc
opica de los fen
omenos fsicos.

La termodinamica constituye un formalismo poderoso de gran generalidad, construido sobre la


base de unas pocas y simples hipotesis. El concepto fundamental introducido en dichas hipotesis es
la entropa, la cual entra en la formulacion de manera abstracta, a traves de un principio variacional
que determina los estados de equilibrio. En el formalismo resultante, no obstante, la entropa es
uno mas entre un conjunto de parametros extensivos, junto con la energa, los n
umeros molares,
el vol
umen, la magnetizacion, etc.. Mientras que las u
ltimas cantidades poseen una interpretaci
on
fsica clara y fundamental, la entropa, desde la termodinamica, adolesce de la misma.
Por otra parte, la termodinamica nos brinda una descripcion macroscopica (esto es, en terminos
de unos pocos parametros globales que adoptan valores a escalas humanas) del comportamiento
sistemas compuestos por un n
umero gigantesco N de partculas interactuantes1 (del orden de un
n
umero de Avogadro 1023 ). Dichas partculas (atomos, moleculas, etc.) obedecen las leyes de
la mecanica (leyes de Newton, en una descripcion clasica o la ecuacion de Schr
odinger, en una
descripcion cuantica). Una descripcion microscopica, por lo tanto, debe basarse en la dinamica de
un sistema de muchos cuerpos, los cuales pueden ser idealizados como partculas puntuales o como
peque
nos cuerpos con unos pocos grados internos de libertad.
La Mecanica Estadstica establece la conexion entre estos dos niveles de descripcion. La cantidad
fundamental para establecer dicha conexion es nuevamente la entropa. Veremos como, a partir de
unos pocos postulados fundamentales sencillos, esta vez a nivel microscopico, es posible derivar
el principio variacional sobre el cual se fundamenta la termodinamica. Esto nos permitira una
encontrar una interpretacion fsica clara para la entropa, a la vez de una receta para calcularla y
con ello derivar relaciones fundamentales a partir de primeros principios.
Al tratar un un n
umero muy grande de partculas, lo primero a destacar es la necesidad de una
descripcion probabilistica del estado de los sistemas.
Pensemos en un sistema aislado. Por simplicidad, podemos considerar un fluido encerrado en
un recipiente adiabatico con paredes perfectamente rgidas y reflectantes. Los vnculos del sistema
son entonces el vol
umen V , la energa U (dado que el sistema esta aislado, podemos identificar la
energa interna con la energa mecanica del sistema) y el n
umero de partculas N . El estado microscopico del sistema debera ser compatible con estos vnculos. Evidentemente, existen muchsimos
estados mecanicos microscopicos compatibles con los valores especificados de U , V y N . El conjun1

Durante el curso de termodin


amica llamamos N al n
umero de moles; de aqui en m
as N designar
a el n
umero de
partculas.

39

40
to de los estados microscopicos compatible con dichos valores constituye un estado macrosc
opico
o macroestado. Para un dado macroestado el sistema puede estar en cualquiera de dichos estados
microscopicos permitidos.
Resulta evidente que es imposible determinar con precision el estado microscopico para cualquier
instante de tiempo. Para ello deberamos ser capaces de resolver las ecuaciones de movimiento para
las N partculas. A
un en el caso en que fueramos capaces (hecho evidentemente falso) para ello
necesitamos conocer con exactitud las condiciones iniciales del sistema, ya sea de las posiciones y
velocidades iniciales de todas las partculas, en una descripcion clasica, o la funcion de onda de las
N partculas a un tiempo dado, en una descripcion cuantica.
Desde un punto de vista macroscopico, sabemos que la especificacion de una pocas variables
globales es suficiente para determinar todas las propiedades de un sistema en equilibrio. En otras
palabras, fijar las condiciones iniciales macroscopicas permite especificar completamente el problema. Sin embargo, si pensamos los sistemas como una coleccion de partculas, es evidente que la
especificacion de las condiciones iniciales macroscopicas no determina de manera unvoca las condiciones mecanicas iniciales. Existe un n
umero enorme de microestados compatibles con casi cualquier
condicion macroscopica que podamos fijar. Si repetimos un mismo experimento muchas veces, la
probabilidad de preparar el sistema en las mismas condiciones iniciales microscopicas es infinitesimal. No obstante, la experiencia demuestra que los fenomenos observados a escala macroscopica son insensibles a esas diferencias. Todas las condiciones iniciales compatibles con los vnculos
macroscopicos son, en cierto sentido, equivalentes y deben ser tratadas en pie de igualdad. Una
manera de expresar esto matematicamente es asignar un peso o probabilidad a todos los posibles
estados del sistema al tiempo cero. Por ejemplo, podemos asignar peso cero a todos los estados incompatibles con los vnculos macroscopicos y un peso diferente de cero, pero igual para todos ellos,
a los estados que son compatibles. Podemos entonces definir las magnitudes macroscopicas (por
ejemplo, la temperatura) como un promedio pesado sobre todos dichos estados de alguna cantidad
dependiente de las variables microscopicas (en el ejemplo de la temperatura, sera el promedio de la
energa cinetica por partcula). Mediante este procedimiento es claro que, para cualquier condicion
inicial, el resultado para cualquier mangitud macroscopica sera siempre el mismo: tenemos una
explicacion para la reproducibilidad de experimentos macroscopicos.
Podemos cuestionarnos acerca del poder predictivo de una teora de este tipo. Esta teora nos
da una prediccion acerca del resultado promedio de un n
umero grande de experimentos realizados
bajo condiciones identicas, pero no nos brinda una prediccion precisa del resultado del mismo. Es
claro que habra fluctuaciones. No obstante, la teora puede predecir las propiedades estadsticas de
dichas fluctuaciones, tal como por ejemplo el desvo medio cuadratico del promedio.
Llegamos as a la idea de la descripcion estadstica de un sistema de muchos cuerpos. El objeto
representativo del sistema no es mas un punto en el espacio de las fases (o un vector de onda en un
espacio de Hilbert), sino una coleccion de puntos en el espacio de las fases, cada uno con un peso
estadstico o probabilidad. En otras palabras, el estado microscopico del sistema esta descripto por
una variable aleatoria (vectorial). Los diferentes puntos en el espacio de las fases en los cuales el
sistema puede encontrarse constituyen los valores posibles de dicha variable aleatoria.
El programa de la Mecanica Estadstica se basa en determinar cual es la distribucion de probabilidad correcta de esta variable. Dicha distribucion de probabilidad debe depender de las proppiedades mecanicas microscopicas y tiene que ser independiente del tiempo para un sistema en
equilibrio.

4.2.

La densidad de probabilidad cl
asica y el concepto de ensemble.

Comenzaremos considerando un sistema clasico, esto es, un sistema de N partculas encerradas


en una caja de vol
umen V , cuya dinamica esta governada por las ecuaciones de Hamilton. Un estado

41
microscopico del sistema en este caso esta determinado por las posiciones y los momentos de todas
las partculas en un instante dado, las cuales determinan de manera unvoca el estado del sistema
en cualquier otro instante. As, para un sistema tridimensional, tendremos 6N variables reales independientes (3 coordenadas y 3 componentes del momento lineal por cada partcula). Vamos a
denotar genericamente dicho estado por (p, q), donde p y q son dos vectores de 3N dimensiones,
cuyas componentes son las de los momentos y las coordenadas respectivamente. Dado que estamos considerando N 1023 partculas y V 1023 vol
umenes moleculares, resultara conveniente
considerar el sistema en el lmite
N

con

V /N = v = cte

Esto se conoce como el lmite termodin


amico.
Sea H = H(p, q) el Hamiltoniano del sistema. La evoluci
on de las variables (p, q) esta dada por
las ecuaciones de Hamilton
dqi
dt
dpi
dt

H(p, q)
pi
H(p, q)
=
qi
=

(4.1)

Si el sistema esta aislado, H no depende explcitamente del tiempo y el sistema es conservativo,


esto es, H es una constante de movimiento
H(p, q) = E

(4.2)

donde E es la energa total del sistema. En este contexto, las paredes del recipiente deben ser
idealizadas como paredes reflectantes perfectas.
La Ec.(4.2) nos define una hipersuperficie en el espacio de las fases, la cual llamaremos genericamente la superficie energa. Todos los puntos de esta superficie constituyen los microestados
accesibles del sistema compatibles con el macroestado definido por la energa E (la superficie tambien depende del vol
umen V y obviamente de N ). A medida que el sistema evoluciona, el punto
(p, q) describira una trayectoria sobre la superficie energa. Dado que las trayectorias en mecanica
clasica estan determinadas unvocamente por las condiciones iniciales, se sigue que las trayectorias
en el espacio de las fases, o bien son cerradas (cclicas) o nunca se cruzan.
Tenemos entonces un n
umero infinito de posibles microestados, los cuales vamos a pensar como
los posibles resultados de una variable aleatoria (p, q). Sea entonces (p, q, t) la densidad de probabilidad de dicha variable aleatoria, esto es, (p, q, t) dp dq nos da la probabilidad de encontrar el
sistema en un elemento de vol
umen dp dq centrado en (p, q) al tiempo t. Podemos entonces pensar en un conjunto denso de puntos sobre la superficie energa, cuya distribucion esta dada por
(p, q, t) dp dq (fraccion de puntos en un vol
umen elemental centrado en (p, q)). Cada uno de dichos
puntos representa una copia del mismo sistema en un microestado diferente. A esta imagen mental
de un conjunto de copias del mismo sistema en todos los posibles diferentes estados se la denomina
ensemble estadstico. Este concepto fue introducido por W. Gibbs.
La densidad de probabilidad debe cumplir con ciertas restricciones. En primer lugar, la misma
tiene que estar normalizada para todo tiempo
Z

(p, q, t) dp dq = 1

(4.3)

donde la integral se extiende a todo el espacio de las fases. La probabilidad P (R, t) de encontrar el
sistema en un vo
umen finito R del espacio de las fases al tiempo t esta entonces dada por
Z

P (R, t) =

(p, q, t) dp dq

(4.4)

42
Consideremos un vol
umen arbitrario V0 centrado en un punto fijo sobre la superficie energa. A
medida que transcurre el tiempo, la probabilidad de encontrar el sistema en dicho vol
umen puede
cambiar. Pero dado que la probabilidad total es constante, el cambio en dicha probabilidad por
unidad de tiempo debe ser igual al flujo de probabilidad a traves de la superficie S que encierra V0 .
En terminos de ensemble, podemos pensar que el mismo se comporta como un fluido en el espacio
de las fases. A medida que el sistema evoluciona, cada punto se mueve a lo largo de una trayectoria.
Dado que esas trayectorias no se cruzan, podemos pensarlas como lineas de flujo. Y dado que
el n
umero total de puntos representativos en el ensemble es constante, el n
umero de trayectorias
tambien lo es.
Sea ~v (p,
q)
la velocidad de un punto en el espacio de las fases y sea J~ ~v una corriente
de probabilidad. El flujo a traves de un elemento de superficie viene entonces dado por ~n.J~ dS,
donde ~n es un vector normal a la superficie y dS es el elemento de area. Tenemos entonces la ley
de conservacion:
dP (V0 )

=
dt
t

I
V0

(p, q, t) dp dq =

~n.J~ dS

(4.5)

Usando el Teorema de Gauss, podemos cambiar la integral de superficie a una integral de vol
umen
obteniendo
Z
V0

(p, q, t) dp dq =
t

Z
V0

. (~v (p, q, t)) dp dq

(4.6)

Dado que V0 es arbitrario, los integrandos de ambos lados de la ecuacion anterior deben ser
iguales y as obtenemos la ecuacion de balance para la probabilidad:
(p, q, t)
+ . (~v (p, q, t)) = 0
t

(4.7)

Ahora bien, de las ecuaciones de movimiento (4.1) tenemos que


.~v =

3N
X
pi
i=1

pi

qi
qi

=0

Reemplazando en la Ec.(4.7) tenemos


(p, q, t)
= ~v .(p, q, t)
(4.8)
t
Esta ecuacion se conoce como Teorema de Liouville. En particular, nos dice que la derivada total
o convectiva de d/dt = 0 para cualquier punto en cualquier instante. La interpretaci
on
geometrica es la siguiente. Si seguimos el movimiento de un punto cualquiera, veremos que la densidad en su entorno permanece constante en el tiempo. En otras palabras, los puntos del ensemble
se mueven como un fluido incompresible. Por otra parte, usando nuevamente las ecuaciones de
movimiento, la Ec.(4.8) puede ser re-escrita como
(p, q, t)
= {, H}
t

(4.9)

donde
{, H} =

H
H

q p
p q

es el parentesis de Poisson de con H. En el caso de una distribucion estacionaria, esto es, una
distribucion donde la densidad no depende explcitamente del tiempo, tenemos entonces la condicion

43

{, H} = 0

(4.10)

La densidad de probabilidad que estamos buscando para describir los estados termodinamicos tiene
que satisfacer esta propiedad. Una forma bastante general de que esta condicion se satisfaga es que
dependa de p y q a traves de una dependencia explicita en H, esto es, (p, q) = [H(p, q)]. La
dependencia mas sencilla de este tipo (luego veremos otras) es = cte en la superficie energa y
cero fuera de ella.
Estamos ahora en condiciones de enunciar el postulado fundamental de la Mecanica Estadstica,
pero antes debemos hacer una consideracion. La energa no puede ser estrictamente constante, ya
que en rigor un sistema totalmente aislado es una idealizacion (existen siempre campos externos
aleatorios debiles de largo alcance, tales como gravitacional, electromagnetico, etc, que se acoplan
con el sistema). Vamos a permitir entonces cierta incerteza en la energa, esto es, considerar que
los estados del ensemble tienen una energa entre E y E + (pensemos en una cascara), donde
E. Esto es mas bien una conveniencia conceptual que simplifica los calculos y, como veremos
en el proximo captulo, no afecta el resultado final (es independiente de ).
Postulado de igual probabilidad a priori: En un sistema aislado en equilibrio todos los microestados accesibles son igualmente probables. Esto es
(

(p, q) =

1
(E)

para
E H(p, q) E +
en caso contrario

(4.11)

donde
Z

(E) =

EH(p,q)E+

dp dq

(4.12)

es el vol
umen ocupado por el ensemble en el espacio de las fases. Notemos que satisface la
normalizacion (4.3). El ensemble definido por la densidad (4.11) se conoce como ensemble microcan
onico y lo estudiaremos en detalle en el siguiente captulo.

4.3.

La Hip
otesis Erg
odica

El postulado de igual probabilidad a priori puede justificarse a traves de lo que se conoce


como hip
otesis erg
odica, la cual se refiere a las propiedades dinamicas de los sistemas bajo
consideracion. Sin embargo, es importante notar que el postulado deber ser considerado como un
axioma de la teora y como tal su validez u
ltima se basa en la contrastaci
on de las predicciones que
del mismo se derivan con los resultados experimentales. En u
ltima instancia, al asumir la hipotesis
ergodica estamos reemplazando un axioma por otro de nivel mas fundamental.
Un sistema Hamiltoniano define un flujo en el espacio de las fases (p(t), q(t)). Sea una funcion
arbitraria f (p, q). Se define el promedio temporal de la funcion f como
1
T T

hf iT = lm

Z t0 +T
t0

f (p(t), q(t)) dt

(4.13)

esto es, el promedio a lo largo de una trayectoria. Por otra parte, el promedio en ensemble de la
funcion f viene dado por
Z

hf i =

f (p, q) (p, q) dp dq =

1
(E)

Z
EH(p,q)E+

f (p, q) dp dq

(4.14)

Un sistema es erg
odico si para casi toda trayectoria (p(t), q(t)) (excepto un conjunto de medida
nula) se cumple que

44

hf i = hf iT

(4.15)

La hip
otesis erg
odica, introducida por Ludwig Boltzmann, consiste en asumir que para N 1
los sistemas son ergodicos. La interpretaci
on es la siguiente. Debido a la inercia de los aparatos de
medicion, lo que realmente se mide en el laboratorio son promedios temporales de magnitudes fsicas,
tomados sobre perodos de tiempo grandes comparados con los tiempos caractersticos de evoluci
on
de los sistemas. Si el sistema es ergodico, la inmensa mayora de las trayectorias compatibles con
los vnculos macroscopicos barren de manera casi uniforme toda la superficie energa. Esto u
ltimo
puede verse de la siguiente manera. Tomemos un vol
umen arbitrario peque
no R sobre la superficie
energa y sea R el tiempo que el sistema pasa en dicho vol
umen. Podemos estimar R introduciendo
la funcion
(

R (p, q) =

1
si
(p, q) R
.
0 caso contrario

De esta manera
R =

Z t0 +T
t0

(p(t), q(t)) dt

y si el sistema es ergodico
R
1
= hiT =
T T
(E)
lm

Z
EH(p,q)E+

(p, q) dp dq =

(R)
(E)

donde (R) es el vol


umen ocupado por R en la superficie energa. Esto es, si el sistema es ergodico,
la fraccion de tiempo que el sistema pasa en una region cualquiera depende solo de su vol
umen y no
de su posicion en la superficie energa. As, el sistema recorre de manera uniforme toda la superficie
y tomar un promedio temporal es equivalente a tomar un promedio en el ensemble microcanonico.
Establecer si un sistema es ergodico o no es un problema altamente complejo (la teora ergodica es
una rama de la matematica que excede el presente curso). Hasta el presente, la hipotesis ergodica
solo ha podido ser verificada de manera rigurosa para unos pocos sistemas simples. Sin embargo,
la computadoras actuales permiten resolver numericamente las ecuaciones de movimiento para un
n
umero bastante grande de partculas con potenciales de interacci
on arbitrarios. Las mismas en
general verifican la hipotesis ergodica.

4.4.

El Operador Densidad en Mec


anica Cu
antica.

Vamos a extender ahora las ideas desarrolladas en la seccion anterior al tratamiento de sistemas
cuanticos. A diferencia del caso clasico, la Mecanica Cuantica tiene un caracater estadstico intrnseco debido al principio de incertidumbre: a
un cuando poseemos la informacion maxima posible
del sistema, solo podemos hacer predicciones de caracter estadstico.
En Mecanica Cuantica un microestado de un sistema es caracterizado por una funcion de onda
(q) (donde q denota al igual que antes las posiciones de las N partculas), la cual es solucion de la
ecuacion de Schrodinger para el sistema de N cuerpos. Esta funcion de onda puede ser desarrollada
en terminos de un conjunto ortonormal completo n (q) de autofunciones de alg
un operador (por
ejemplo, la energa):
(q) =

cn n (q)

(4.16)

donde |cn |2 nos da la probabilidad de encontrar el sistema en el autoestado n . De la normalizacion


P
de la funcion de onda tenemos que n |cn |2 = 1. El valor promedio (o valor esperado) cuantico de
(observable) en el microestado (q) viene dado por
un operador cualquiera O

45
D

|O|
=

(q) dq =
(q) O

cm cn Omn

(4.17)

m,n

n son los elementos de matriz del operador O


en la base considerada.
donde Omn = m |O|
Todos los resultados anteriores son validos si conocemos exactamente el microestado (q), esto
es, si tenemos un estado puro. No obstante, las mismas consideraciones del caso clasico se aplican
aqu. Dado un conjunto de vnculos macroscopicos, tendremos una cantidad enorme de microestados
(i) (q) compatibles con los mismos y resulta imposible predecir con exactitud en cual de ellos se
encuentra el sistema. Lo maximo que podemos aspirar es a asignarle al sistema una probabilidad
pi de estar en el estado (i) (q). Esta es la generalizacion del concepto de ensemble al caso cuantico.
El paso siguiente es establecer como se calcula el promedio de un observable cuando el sistema
es especificado en esta forma estadstica. Para ello desarrollamos cada uno de los estados accesibles
en la base ortonormal n (q):
(i) (q) =

c(i)
n n (q).

(4.18)

en uno de los estados (i) (q) esta dado por


El promedio cu
antico del operador O
D

(i) =
(i) |O|

(i)
c(i)
m cn Omn

(4.19)

m,n

Esta cantidad tiene una probabilidad pi de ocurrencia. Para obtener el promedio en ensemble
debemos promediar a su vez sobre los microestados del mismo:
D E

=
O

(i) =
pi (i) |O|

donde se asume que pi 0 y


matriz son

pi

i pi

(i)
c(i)
m cn Omn

(4.20)

m,n

= 1. Introduciendo ahora una matriz cuyos elementos de

nm =

(i)
pi c(i)
n cm

(4.21)

podemos expresar
D E

=
O

nm Omn

(4.22)

m,n

Denotemos ahora el operador cuyos elementos de matriz en la base n (q) son mn :


Z

mn =

dq m (q) n (q) hm |
|n i ;

(4.23)

se conoce como el operador densidad de probabilidad. Es facil probar que el mismo es


hermitiano. De la Ec.(4.22) tenemos que
D E

=
O

nn =
(
O)

XD

n
n |
O|

(4.24)

As, el promedio en ensemble de un observable resulta igual a la suma de los elementos diagonales
Pero la traza de una matriz u operador es una propiedad independiente
o traza del operador O.
de la base escogida, de manera que podemos expresar
D E

= Tr O
= Tr O

O

(4.25)

46
donde hemos usado la propiedad de invariancia de la traza de un producto de matrices (operadores)
ante permutaciones cclicas de los factores. Notemos que
Tr =

pi

|cn |2 =

pi = 1

De la Ec.(4.21) podemos escribir el operador como un producto matricial


=

pi (i) (i)

(4.26)

donde

c1
.
..

(i) = (c1 , , cl , )

(i) =

cl

..
.

Los microestados (i) son soluciones de la ecuacion de Schr


odinger
i
h

(i)
(i)
=H
t

(4.27)

es el operador Hamiltoniano. Trasponiendo la ecuacion anterior y tomando el complejo


donde H
conjugado
(i)

= (i) H
(4.28)
t
=H
. Derivando la Ec.(4.26) obtenemos
donde hemos usado que el Hamiltoniano es hermitiano H
i
h

X

ih
= ih
pi
t
i

(i)
(i)

(i) (i)
+

H
(i) (i)
pi (i) (i) H

H
)
= (
H
esto es

= [
, H]
(4.29)
t
donde [., .] denota el conmutador. Esta ecuacion es el equivalente del Teorema de Liouville en
Mecanica Cuantica. Si el sistema se encuentra en equilibrio tenemos que
i
h

=0
[
, H]
en la cual es
lo cual implica que siempre podemos encontrar una base de autoestados de H

tambien diagonal. Sea entonces n una base de autoestados del operador Hamiltoniano H:
n = En n
H

(4.30)

donde En es el autovalor del Hamiltoniano correspondiente al autoestado n . Si es diagonal en


esta base, de la Ec.(4.22) tenemos

47
D E

=
O

nn Onn

(4.31)

(i)

donde nn = i pi |cn |2 0 y n nn = 1. nn puede interpretarse como la probabilidad de


encontrar el sistema en el autoestadoestado n .
Podemos enunciar ahora el postulado de igual probabilidad a priori en su versi
on cuantica.
Consideremos un sistema aislado con energa E (o energa entre E y E + , seg
un convenga). Sea
l con l = 1, 2, . . . , M (E) el subconjunto de autoestados correspondientes al autovalor E. Entonces
ll =

1
para l = 1, 2, . . . , M (E)
M (E)

(4.32)

Captulo 5

El ensemble microcan
onico
El postulado de igual probabilidad a priori nos dice que, en un sistema aislado con energa E,
la probabilidad de encontrar el sistema en un microestado es la misma para todos los microestados
compatibles con los vnculos macroscopicos e igual a la inversa del n
umero total de microestados
(en el caso clasico, el vol
umen de la hipersuperficie de energa constante es una medida del n
umero
de microestados). As, dado el Hamiltoniano del sistema (clasico o cuantico) podemos calcular
la distribucion de probabilidad (ya veremos varios ejemplos en breve). Una vez que tenemos la
distribucion de probabilidad podemos calcular promedios de magnitudes tales como la energa,
magnetizacion, etc, ya que las mismas estan directamente asociadas a propiedades mecanicas. Sin
embargo, hay una cantidad que hasta aqui el formalismo no nos dice como calcularla: la entropa.
Para establecer las bases de la termodinamica debemos comenzar entonces por postular una forma
microscopica para la entropa.

5.1.

La entropa de Boltzmann-Gibbs

Si asumimos que toda la informacion esta contenida en la distribucion de probabilidad, la


entropa debera ser calculable a partir de la misma. Dado que la distribucion de probabilidad es
una funcion del n
umero de microestados la entropa tambien lo sera.
Llamaremos genericamente W (E) al n
umero de microestados con energa E. En el caso cuantico
W (E) es directamente el n
umero de autoestados M (E) con energia E. En el caso clasico estamos
tentados a identificar W (E) con (E), pero debemos ser cuidadosos. En primer lugar, W tiene que
ser adimensional y (E) tiene dimensiones de (distanciamomento)3N (o (momento angular)3N ).
Por otra parte, sabemos que una descripcion clasica debe resultar consistente con la descripcion
cuantica en alg
un lmite apropiado (como veremos, esto corresponde a los lmites de baja densidad
y/o altas temperaturas). Para ello debemos incorporar la restriccion impuesta por el principio de
incertidumbre, por el cual la maxima precision que podemos tener en una determinacion simult
anea
de cada componente de posicion y momento es pq h. Asi, resulta razonable suponer que el
espacio de las fases esta dividido en celdas de vol
umen h3N , dentro de las cuales el punto no puede
ser definido con precision (h tiene dimensiones de momento angular). Estas celdas pueden ponerse
en correspondencia uno a uno con los estados cuanticos del sistema y por lo tanto el n
umero de
microestados correspondera al n
umero de dichas celdas W (E) = (E)/h3N . Volvamos entonces a
la relacion entre la entropa y W (E). La definicion microscopica de entropa que adoptemos tiene
que satisfacer dos condiciones: a) S tiene que ser extensiva y b) Tiene que cumplir el principio
variacional enunciado en el segundo postulado de la termodinamica.

49

50

5.1.1.

La formulaci
on de Boltzmann

Consideremos un sistema en el cual un vnculo es removido, por ejemplo, abirendo una valvula
que permite al sistema expandirse a un vol
umen mayor, hasta alcanzar el equilibrio. Desde el punto
de vista macroscopico esto implica un aumento en la entropa. Desde el punto de vista microscopico,
aumentar el vol
umen accesible al sistema implica un aumento del n
umero de microestados accesibles. Esto sugiere la identificacion de la entropa con W . Sin embargo, esto presenta la dificultad de
que W es una cantidad multiplicativa, mientras que la entropa es una cantidad aditiva (el n
umero
de estados accesibles de dos sistemas es el producto del numero de estados de cada subsistema,
al igual que el n
umero de estados de dos dados 6 6 = 36). Necesitamos entonces una funcion
S = f (W ), con la propiedad f (W1 W2 ) = f (W1 ) + f (W2 ) para todo par de valores W1 , W2 . Es
posible demostrar que la u
nica funcion contnua que satisface esta propiedad es f (x) = k ln x.
Llegamos as al segundo postulado de la Mecanica Estadstica mediante la definicion
S(E) = kB ln W (E)

(5.1)

Esta forma de la entropa fue introducida por Ludwig Boltzmann y se la suele llamar entropa
de Boltzmann; la misma se encuentra inscripta en el t
umulo de L. Boltzmann en Viena. El
prefactor en la Ec.(5.1) es adimensional (recordemos que la entropa lo es) y se elige de manera de
obtener un acuerdo con la escala Kelvin de temperatura T 1 = S/E. Veremos que tal acuerdo se
obtiene eligiendo que esta sea la constante de Boltzmann kB = R/NA = 1,2807 1023 J/K; esta
identificacion fue demostrada por primera vez por Plank, quien la bautizo con su nombre actual.
Vamos a ver que esta definicion satisface las propiedades requeridas.
Supongamos por simplicidad un sistema clasico. De acuerdo a nuestra definicion, la entropa es

S(E) = kB ln

(E)
h3N

(5.2)

donde (E) es el vol


umen de una cascara encerrada entre las superficies de energa constante H = E
y H = E + .
Consideremos el caso tpico de equilibrio termico de dos sistemas (1) y (2) (pensemos dos
fluidos). Inicialmente tenemos cada sistema en un recipiente perfectamente rgido, separados por
una pared adiabatica y rgida, de tal manera que cada subsistema tiene un vol
umen fijo V1 y
V2 , as como un n
umero de partculas fijo N1 y N2 respectivamente. Si la pared es perfectamente
adiabatica los subsistemas no interact
uan y el Hamiltoniano total del sistema sera
H(p, q) = H1 (p1 , q1 ) + H2 (p2 , q2 )

(5.3)

donde (p1 , q1 ) y (p2 , q2 ) denotan respectivamente las coordenadas y momentos de las partculas
contenidas en cada subsistema.
Supongamos que inicialmente el subsistema (1) tiene energa entre E10 y E10 + y el subsistema
(2) entre E20 y E20 + . El n
umero de microestados de cada sistema en su ensemble respectivo es
0
3N
0
3N
1
2
1 (E1 )/h
y 2 (E2 )/h , de manera que las entropas de cada subsistema, de acuerdo con la
definicion (5.2), son
S1 (E10 , V1 , N1 )

S2 (E20 , V2 , N2 )

= kB

= kB

1 (E10 )
ln
h3N1
2 (E20 )
ln
h3N2

Si los subsistemas estan aislados, el ensemble del sistema compuesto esta dado por todos los
puntos del espacio de las fases tal que (a) las coordenadas de las N1 partculas estan contenidas

51
en el vol
umen V1 ; (b) las coordenadas de las N2 partculas estan contenidas en el vol
umen V2 ; (c)
0
0
la energa del subsistema i esta entre Ei y Ei + . La energa del sistema total esta entre1 E y
E + 2, con E = E10 + E20 . El vol
umen de este ensemble es claramente
(E) = 1 (E10 ) 2 (E20 )
de donde se sigue que
S(E, V, N ) = S1 (E10 , V1 , N1 ) + S1 (E20 , V2 , N2 )
donde
V = V1 + V2
N = N1 + N2
Supongamos que ahora se remueve el vnculo adiabatico, de manera que los sistemas pueden
intercambiar energa a traves de la pared, manteniendo los vol
umenes macroscopicos V1 y V2 fijos.
Podemos pensar en colisiones inelasticas de las partculas que transmiten energa a la pared, produciendo vibraciones que no alteran los vol
umenes promedio, pero pueden transmitir energa a su
vez al otro subsistema. La presencia de la pared diatermica introduce una interacci
on efectiva entre
las partculas de ambos subsistemas, con lo cual deberamos adicionar un termino Hint (p1 , q1 , p2 , q2 )
al Hamiltoniano (5.3). Sin embargo, si la interacci
on es de corto alcance, dicho termino tendra peso
u
nicamente para partculas en las cercanas de la interface entre ambos subsistemas, siendo por lo
tanto proporcional a su area. En el lmite termodinamico V1 y V2 la relacion superficie/vol
umen tiende a cero y dicho termino puede despreciarse en comparacion con las energas
internas de cada subsistema. Es importante notar que, desde un punto de vista microscopico, esto
solo es valido si no existen potenciales de interacci
on fuertes de largo alcance2
As, el efecto principal de remover el vnculo es el de permitir el intercambio de energa entre
los subsistemas. El ensemble para este sistema resulta entonces ampliado respecto del sistema no
interactuante, ya que ahora cada subsistema podra adoptar cualquier par de valores E1 y E2 que
satisfagan E1 + E2 = E. Para cada par de valores posibles (E1 , E2 ) que satisfacen esta condicion
el n
umero de estados accesibles del sistema completo con energa entre E y E + 2 es
W (E) =

(E)
1
= 3N 1 (E1 ) 2 (E E1 )
3N
h
h

Para obtener el n
umero total de estados tenemos entonces que sumar esta cantidad sobre todos los
pares posibles de valores de E1 y E2 compatibles con la energa total E. Dado que E1 y E2 son
valores posibles de los Hamiltonianos H1 (p1 , q1 ) y H2 (p2 , q2 ), su espectro de valores esta acotado por
debajo ya que de otra manera los subsistemas no seran estables. Por simplicidad, asumiremos que
la cota inferior para ambos espectros es cero. Si dividimos cada espectro de energa en intervalos
de tama
no , entonces entre cero y E tenemos E/ intervalos en cada espectro. Para E
podemos aproximar:
1

Como veremos, en el lmite termodin


amico el valor de la constante resulta irrelevante para las predicciones de
la teora. As, no tiene importancia que la c
ascara del sistema total sea mas gruesa que las de los subsistemas
2
Este sera el caso de partculas cargadas electricamente que interact
uan via un potencial de Coulomb. En principio, los sistemas de partculas con interacciones de largo alcance no son extensivos y la cuesti
on del equilibrio
termodin
amico es un problema delicado y en general no bien resuelto. En el caso de las interacciones gravitatorias, las mismas pueden despreciarse (al menos para sistemas moleculares) ya que, si bien de largo alcance, son
extremadamente debiles comparadas con otros potenciales de interacci
on moleculares, tales como las fuerzas de Van
der Waals.

52

E/

(E) =

1 (Ei ) 2 (E Ei )

(5.4)

i=1

donde Ei es la energa en el centro del intervalo i-esimo. Esta es una suma sobre E/ terminos.
Vamos a mostrar que en el lmite termodinamico esta suma esta dominada por un u
nico termino.
(E) crece monotonamente con la energa, ya que a medida que aumenta la misma aparecen
nuevos estados accesibles. As, mientras 1 (Ei ) crece, 2 (E Ei ) decrece y viceversa. La funcion
1 (Ei ) 2 (E Ei ) debe por lo tanto presentar un maximo para alg
un valor de 0 Ei E. Sean
E 1 y E 2 = E E 1 los valores de energas para los cuales el producto 1 (E1 ) 2 (E2 ) es maximo.
Tenemos entonces que
1 (E 1 ) 2 (E 2 ) (E)

E
1 (E 1 ) 2 (E 2 )

o
h

E
(5.5)

En general uno observa que el n


umero de microestados de un sistema molecular crece exponencialmente con el n
umero de partculas, esto es, para N1 , N2 se tiene que
ln 1 (E 1 ) 2 (E 2 ) ln (E) ln 1 (E 1 ) 2 (E 2 ) + ln

ln 1 N1
ln 2 N2
lo cual resulta consistente con la extensividad de la entropa, mientras que
E N = N1 + N2 .
Por lo tanto, el termino ln(E/) en la Ec.(5.5) puede ser despreciado, ya que es independiente
de N . Por lo tanto
S(E, V, N ) = S1 (E 1 , V1 , N1 ) + S2 (E 2 , V2 , N2 ) + O(ln N )

(5.6)

Hemos obtenido entonces que la entropa de Boltzmann es extensiva (en el lmite termodinamico)
y que los subsistemas en equilibrio adoptan energas bien definidas E 1 y E 2 . Entendamos mejor
esto. La hipotesis fundamental es que
i eNi Fi (Ei ) i = 1, 2
donde las funciones Fi son intensivas (esto es, se vuelven independientes de N para N ); esto,
como veremos en numerosos ejemplos, es absolutamente generico. Asumamos por simplicidad que
N1 = N2 = N/2. Tenemos entonces que
1 (E1 ) 2 (E E1 ) eN g(E1 )
donde la funcion g es tambien intensiva y tiene su maximo en E1 = E 1 . As, podemos expresar la
suma (5.4) como
(E)

X
E1

eN g(E1 )

eN g(E 1 ) 1 +

X
E1 6=E 1

eN (g(E 1 )g(E1 ))

(5.7)

53
Dado que g(E 1 ) g(E1 ) > 0 E1 6= E 1 , todos los terminos de la suma decaen rapidamente a cero.
Cada valor de E1 define un macroestado particular del sistema total, en el cual el subsistema 1 tiene
energa macroscopica E1 y el susbsistema 2 energa E2 . Dicho macroestado particular define un subensemble. Dado que totos los microestados del sistema total son equiprobables, la probabilidad de
que el sistema se encuentre en un macroestado particular con energas E1 y E2 viene dada por el
cociente entre el n
umero de estados del subensemble asociado 1 (E1 ) 2 (E2 ) y (E). Llamemos
entonces R al subensemble correspondiente a las energias E 1 y E 2 . La probabilidad de encontrar
el sistema en el mismo es
P (R) =

1 (E 1 ) 2 (E 2 )
1

P
N
(E)
1 + E1 6=E 1 e (g(E 1 )g(E1 ))

y por lo tanto P (R) 1 cuando N . El crecimiento exponencial en N del n


umero de
microestados hace que, para N suficientemente grande, la inmensa mayora de los estados accesibles
correspondan a R. Todos estos argumentos se aplican exactamente igual al caso cuantico.
Los valores que adoptan entonces las energas de cada subsistema en ausencia del vnculo son
aquellos que maximizan el producto 1 (E1 ) 2 (E2 ) bajo la restriccion E1 + E2 = E, esto es
[1 (E1 ) 2 (E2 )] ,

E1 + E2 = 0

lo cual lleva a la condicion


2 (E2 )

1 (E1 )
2 (E2 )
E1 + 1 (E1 )
E2 = 0
E1
E2

(5.8)

1 1 (E1 )
1 (E1 ) E1

E1 =E 1

ln 1 (E1 )
E1
E1 =E 1

S1 (E1 )
E1
E1 =E 1

1 2 (E2 )
2 (E2 ) E2

E2 =E 2

ln 2 (E2 )
=
E2
E2 =E 2

S2 (E2 )
=
E2
E2 =E 2

(5.9)

Es decir, los valores que adoptan las energas de cada subsistema son aquellos maximizan la
entropa total S(E) = S1 (E1 )+S2 (E2 ) entre todos los conjuntos de valores que conservan la energa
total. Esto no es ni mas ni menos que el enunciado del II Postulado de la Termodinamica. Desde el
punto de vista microscopico, el macroestado que maximiza la entropa no es el u
nico posible, pero
la probabilidad de encontrar el sistema en otro macroestado es extremadamente peque
na cuando
N es suficientemente grande.
Tomado la definicion termodinamica de temperatura
S(E)
1

E
T
la Ec.(5.9) nos da la conocida condicion de equilibrio termico
1
1
=
T1
T2

(5.10)

(5.11)

Las condiciones de equilibrio mecanico (es decir, al liberar el vnculo que mantiene la pared
fija, ademas de volverla diatermica) se obtienen de manera semejante, tomando en cuenta que el
n
umero de microestados es claramente una funcion creciente del vol
umen (queda como ejercicio
para el lector). Vemos as que la entropa de Boltzmann satisface todos los requisitos establecidos
por los postulados de la termodinamica y por lo tanto

54

S(E, V, N ) = kB ln W (E, V, N )
constituye una relaci
on fundamental. Sin embargo, conviene recalcar que esto es cierto solamente en el lmite termodin
amico. Solo en dicho lmite la entropa anterior es una funcion homogenea de primer orden de los parametros extensivos. Por otra parte, tenemos una interpretaci
on
estadstica clara para el segundo postulado: el macroestado que maximiza la entropa es aquel que
contiene el mayor n
umero de microestados, solo por el hecho de que este es el mas probable. Otros
macroestados no estan excluidos, pero su probabilidad se vuelve infinitesimalmente peque
na cuando
el n
umero de partculas se vuelve suficientemente grande.
Antes de continuar con el desarrollo de la teora, veremos algunos ejemplos.

5.2.

Algunos ejemplos

5.2.1.

El gas ideal monoat


omico cl
asico

Al igual que en termodinamica, el gas ideal monoatomico clasico es el sistema mas simple
que podemos considerar: N partculas puntuales identicas no interactuantes en un vol
umen V . El
Hamiltoniano del sistema es
H(p, q) =

3N
1 X
p2
2m i=1 i

(5.12)

donde m es la masa de las partculas. Tenemos que calcular el vol


umen en el espacio de las fases
(E) dado por la Ec.(4.12). Para ello resulta conveniente introducir la funcion
Z

(E) =

H(p,q)E

dp dq

(5.13)

Dado que la energa dada por la Ec.(5.12) esta acotada por abajo, esta integral es finita (para N
finito). Tenemos entonces que
(E) = (E + ) (E)
Si se elige tal que E, tenemos que
(E) = (E)

(5.14)

donde
(E)
(5.15)
E
Un calculo semejante al utilizado para obtener la relacion (5.6) muestra que las siguiente definiciones
son equivalentes, a menos de un termino aditivo de orden ln N o menor:
(E) =

S = kB ln[(E)/h3N ]

(5.16)

3N

(5.17)

3N

(5.18)

S = kB ln[(E)/h
S = kB ln[(E)/h

Calculemos entonces (E) para el gas ideal. Dado que el Hamiltoniano es independiente de las
posiciones, la integracion de las mismas en la Ec.(5.13) es directamente la integral de la posicion
de cada partcula en el vol
umen V y por lo tanto

55
Z

(E) = V
Definiendo R =

dp1 . . . dp3N

H(p,q)E

(5.19)

2mE, la condicion H = E resulta


3N
X

p2i = R2

i=1

y asi
(E) = V N 3N (R)

(5.20)

donde
Z

n (R) =

x21 ++x2n R2

dx1 dxn

(5.21)

es el vol
umen de una hiperesfera de radio R en n dimensiones. Para calcular n notemos primero
que
n = Cn Rn

(5.22)

donde Cn es una constante independiente de R. Para calcular Cn vamos a usar la identidad


Z

dx1

dxn e

(x21 ++x2n )

dxe

= n/2

(5.23)

x21 + + x2n . Tenemos que

Sea ahora f (r) una funcion arbitraria del radio r =


Z
x21 ++x2n R2

x2

f (r) dx1 dxn =

Z R
0

Sn (r) f (r) dr

(5.24)

donde Sn (r) es la superficie de una hiperesfera de radio R en n dimensiones. As


n (R) =

Z R
0

Sn (r) dr

(5.25)

y por lo tanto
dn (R)
= n Cn Rn1
dR
El lado izquierdo de la Ec.(5.23) puede ser entonces expresado como
Sn (R) =

dx1

dxn e

(x21 ++x2n )

Z
0

dr Sn (r) er

= n Cn
=

1
n Cn
2

dr rn1 er

dt t

(5.26)

(n/2)1 t

1
= n Cn
2

n
1 ! (5.27)
2

donde hemos usado que la u


ltima integral es la funcion gamma de argumento n/2. Comparando
las Ecs.(5.23) y (5.27) obtenemos finalmente
Cn =

2 n/2
n (n/2 1)!

(5.28)

56
Por lo tanto
h

(E) = C3N V (2mE)3/2

iN

(5.29)

Notemos que (E) (y por lo tanto (E)) crece exponencialmente con N , como habamos supuesto
en la seccion anterior. De la Ec.(5.17) obtenemos entonces la entropa para el gas ideal

V
+ N ln
(2mE)3/2
h3

S(E, V, N ) = kB ln C3N

(5.30)

De la Ec.(5.28), utilizando la aproximaci


on de Stirling
ln m! m ln m m para m

(5.31)

obtenemos finalmente
"

S(E, V, N ) = N kB ln V

4 m E
3h2 N

3/2 #

3
N kB
2

(5.32)

Invirtiendo esta ecuacion, podemos despejar E en funcion de los restantes parametros. Llamando
a la funcion resultante U (S, V, N ) tenemos

U (S, V, N ) =

3h2
4 m

N
2S
exp
1
2/3
3 N kB
V

(5.33)

La temperatura es

T =

U
S

=
V

2 U
3 N kB

(5.34)

de donde se sigue que la capacidad calorfica a vol


umen constante es (para obtener el calor especfico
hay que dividir por el n
umero molar)

CV =

U
T

3
= N kB
2

(5.35)

Finalmente,

P =

U
V

=
S

2U
N kB T
=
3V
V

(5.36)

Expresando N = NA Nm , donde Nm es el n
umero molar y NA es el n
umero de Avogadro se sigue
de las expresiones anteriores que kB = R/NA , donde R es la constante universal de los gases.
A pesar de que hemos obtenido las ecuaciones de estado del gas ideal correctamente, el lector
debe notar un hecho importantsimo. Si multiplicamos E, V y N por un factor arbitrario, de la
Ec.(5.32) obtenemos que S(E, V, N ) 6= S(E, V, N ). Esta entropa no es extensiva! Si calculamos la ecuacion de estado para el potencial qumico , veremos que el mismo no es una funcion
intensiva de los parametros termodinamicos.
Gibbs resolvio este problema de manera emprica, postulando que el calculo del n
umero de
microestados esta sobre-estimado y proponiendo de manera ad hoc la correccion (E) (E)/N !.
Al hacer esto, debemos sustraer de la Ec.(5.32) el termino ln N ! N ln N N , con lo cual obtenemos
"

V
S(E, V, N ) = N kB ln
N

E
N

3/2 #

3
N kB
2

5
4 m
+ ln
3
3h2

(5.37)

Esta expresion se conoce como F


ormula de Sackur y Tetrode y ha sido verificada experimentalmente. La correccion de dividir el n
umero de microestados por N ! se conoce como contaje

57
correcto de Boltzmann3 . La misma no afecta las ecuaciones de estado para P y T , ya que el
termino sustrado en la entropa no depende de E ni de V .
No es posible entender clasicamente porque debemos dividir (E) por N ! para obtener el
contaje correcto de estados. La razon es inherentemente cuantica y esta en la indistinguibilidad
de partculas identicas en Mecanica Cuantica.
Si las funciones de onda de dos partculas identicas se pueden superponer (como en el caso de un
gas) no existe manera de seguirlas individualmente, ya que las mismas no son entidades localizadas.
Lo que tenemos es un u
nico estado de dos partculas. Esto significa que, dada la funcion de onda
de las N partculas, si permutamos las posiciones de dos cualesquiera de ellas la funcion de onda
cambia a lo sumo en un factor de fase (ya que lo que tiene sentido fsico es el modulo de la funcion de
onda). Esto no existe en mecanica clasica, en donde cada partcula es una entidad con una posicion
espacial perfectamente definida y por lo tanto en principio es posible seguir el comportamiento
individual de cada una. Supongamos un estado microscopico en el cual la partcula A se encuentra
en la posicion q1 con momento p1 y la partcula partcula B se encuentra en la posicion q2 con
momento p2 ; si ahora consideramos el mismo microestado (esto es, con las restantes partculas
con las mismas posisiciones y momentos) pero con la partcula A en la posicion q2 con momento
p2 y la B en la posicion q1 con momento p1 , ambos estados son diferentes. De esta manera, al
considerar que las partculas en el gas son distinguibles, por cada conjunto particular de valores
de posiciones y momentos contamos todas las posibles permutaciones de partculas entre dichos
estados individuales (N !). Dado que en caso cuantico todas esas permutaciones constituyen un
u
nico estado, debemos dividir (E) por N !.
La argumentacion anterior claramente no es una derivaci
on del contaje correcto de Boltzmann,
solo es un justificacion general de su orgen. A medida que avancemos en la materia veremos como
el mismo emerge naturalmente del tratamiento cuantico correcto de partculas indistinguibles.
Como ya mencionamos, a temperaturas altas y bajas densidades los sistemas se comportan de
acuerdo con la Mecanica Clasica. Esto es cierto en todo, excepto en la cuestion de la indistinguibilidad. As, arribamos a la siguiente regla general: a altas temperaturas y bajas densidades, los
sistemas de partculas indistinguibles admiten una descripcion clasica (considerando las partculas
como distinguibles), con la correccion dada por el contaje correcto de Boltzmann. Este enfoque
suele denominarse Estadstica de Maxwell-Boltzmann.
Hay que recalcar que partculas cuanticas identicas pueden ser tambien distinguibles en determinadas situaciones, por ejemplo, atomos en una solido cristalino. Dado que cada atomo tiene una
posicion fija bien definida, el permutar los estados individuales de dos atomos diferentes conduce a
un nuevo estado microscopico. Veremos un ejemplo de este tipo a continuaci
on

5.2.2.

El s
olido de Einstein

Con frecuencia los materiales en estado solido presentan una estructura regular, en la cual los
atomos vibran alrededor de posiciones relativas fijas, la cuales se ordenan en forma de arreglos
periodicos (podemos pensar en una grilla). Estos arreglos periodicos se conocen como cristales
o redes de Bravais.
En 1906 Einstein propuso un modelo microscopico simple para explicar el comportamiento
caracterstico del calor especfico de los solidos con la temperatura: el mismo tiende a cero para
T 0 y se vuelve constante para altas temperaturas (esto u
ltimo se conoce como ley de Dulong y
Petit). Si bien el calor especfico es el resultado de diversas contribuciones (por ejemplo, electronica)
es posible ver que la principal contribuci
on proviene de las vibraciones atomicas. El modelo de
Einstein consiste entonces en asociar un oscilador armonico tridimensional independiente a cada uno
3

Algunos autores llaman con justicia factor de Gibbs a la correcci


on 1/N !. Sin embargo, he preferido mantener
la denominaci
on de contaje correcto de Boltzmann para evitar confusi
on, ya que existe una larga tradici
on en la
literatura de llamarlo as.

58

Figura 5.1: M bolas distribuidas en 3N cajas. ni nos da el n


umero de bolas en la caja i-esima. En
el ejemplo n1 = 2, n2 = 3, n3 = 0, n4 = 1, etc.

de los N sitios de un cristal. Los osciladores no interact


uan entre ellos y se asume que todos tienen
la misma frecuencia . Un autoestado de este sistema es entonces el producto de los autoestados
de cada uno de los osciladores (los osciladores son independientes y distinguibles). En esta base el
Hamiltoniano del sistema (y por lo tanto la matriz densidad) es diagonal y viene dado por
H = h

3N
X

(ni + 1/2) = h

i=1

3N
X

ni +

i=1

3
h N

(5.38)

donde ni = 0, 1, 2, . . . es el n
umero cuantico que describe el autoestado individual del oscilador
i-esimo. Un microestado queda entonces epecificado por un conjunto particular de valores para los
3N n
umeros cuanticos ni . El n
umero de microestados W (E) para a un valor dado de la energa
total E se obtiene entonces a partir de la condicion
h

3N
X

ni +

i=1

3
h N = E

o bien
3N
X

ni = M =

i=1

3
E
N
2
h

Esto claramente nos impone una restriccion sobre los posibles valores de E, ya que M tiene que
ser entero. En otras palabras, el sistema total tiene un espectro discreto. No obstante, E N y
la variacion relativa de E sera E/E
h/N 0 para N , con lo cual el espectro puede
considerarse aproximadamente contnuo.
El problema de la determinacion de W (E) consiste entonces en, dado un entero positivo M ,
calcular el n
umero de posibles combinaciones de 3N enteros positivos n1 , . . . , n3N tales que
3N
X

ni = M

(5.39)

i=1

Podemos resolver este problema combinatorio mediante el siguiente esquema mental. Supongamos que tenemos M bolas alineadas en una caja unidimensional. Supongamos ademas que la caja
permite poner paredes divisorias entre cada par de bolas y que disponemos de 3N 1 de tales
paredes. Una configuracion particular de paredes va a dividir la caja completa en 3N subcajas,
cada una conteniendo n1 , . . . , n3N bolas, como se muestra esquematicamente en la Fig.5.1. Vamos
a suponer ademas que un n
umero arbitrario de paredes pueden ubicarse en la misma posicion, de
manera que puede haber cajas que no contienen ninguna bola. Por ejemplo, podramos poner
todas las paredes en la primera posicion, de manera que n1 = 1, n3N = M 1 y ni = 0 para
P
on particlos restantes casos. Por construccion, tenemos que 3N
i=1 ni = M . Para cada configuraci
ular de posiciones de las paredes tenemos una configuracion diferente de enteros n1 , . . . , n3N que
satisfacen la condicion (5.39). Moviendo las paredes de lugar podemos recorrer todas las posibles
combinaciones de enteros que satisfacen (5.39). Tenemos 3N 1 + M objetos de dos clases (paredes

59
y bolas). W puede calcularse como el n
umero de permutaciones de dichos objetos, en las cuales se
descuentan las permutaciones de objetos del mismo tipo, esto es, el n
umero combinatorio:

W (E) =

3N + M 1
M

(3N + M 1)!
M ! (3N 1)!

(5.40)

(3N + M 1)!
S(E, N ) = kB ln
M ! (3N 1)!

(5.41)

(para este modelo el vol


umen no es una variable termodinamica independiente, ya que V = a N ,
donde a es una constante que depende de la estructura cristalina particular). Definiendo la entropa
y la energa por atomo como s = S/N y u = E/N respectivamente, encontramos en el lmite
termodinamico N que

s(u) = 3kB

u 1
u 1
+
ln
+

u 1
u 1

ln

(5.42)

donde hemos usado la formula de Stirling y 3


h. Esta es la relacion fundamental para el solido
de Einstein. La ecuacion de estado para la temperatura viene dada por

s
3kB
u 1
1
=
=
ln
+
T
u

u 1
ln

(5.43)

Invirtiendo esta ecuacion, obtenemos la energia por atomo en funcion de la temperatura:


u(T ) =

3h
3

h +

2
exp khBT 1

(5.44)

En el lmite de bajas temperaturas kB T


h obtenemos la energa cuantica del punto cero
u (3/2)
h (cada oscilador armonico se encuentra en su estado fundamental). En el lmite de
altas temperaturas kB T h tenemos que u kB T . El calor especfico de este modelo viene dado
por
u
c(T ) =
= 3kB
T

h
kB T

2
h

exp

h
kB T

i2

(5.45)

y se muestra en la Fig.5.2. En el lmite de altas temperaturas T TE = h/kB , donde la temperatura de Einstein es del orden de los 100 K para la mayora de los solidos cristalinos mas comunes,
encontramos que c 3kB . Esta es la ley de Dulong y Petit. A bajas temperaturas T TE el calor
especfico se anula exponencialmente con la temperatura:

c 3kB

h
kB T

2h
exp
kB T

El modelo de Einstein describe de manera cualitativamente correcta los aspectos globales del
comportamiento del calor especfico. Sin embargo, cuando a
nos despues del trabajo pionero de
Einstein se midio con alta precision esta cantidad, se encontr
o que la misma tiende a cero como
T 3 . Un modelo mas sofisticado para explicar este comportamiento fue introducido por Debye y lo
veremos mas adelante.

60

Figura 5.2: Calor especfico del modelo de Einstein en funcion de la temperatura.

5.2.3.

El calor especfico de un s
olido cl
asico

Resulta instructivo considerar la versi


on clasica del solido de Einstein. El Hamiltoniano clasico
de un conjunto de 3N osciladores armonicos independientes viene dado por

3N
1X
1 2
H(p, q) =
p + m 2 qi2
2 i=1 m i

(5.46)

Calculemos
Z

(E) =

H(p,q)E

dp dq

p
Haciendo el cambio de variables xi = pi / 2m para i = 1, . . . , 3N y xi = qi m/2 para
i = 3N + 1, . . . , 6N tenemos que
3N Z

(E) =

3N

x21 ++x26N R2

dx1 dx6N =

6N

3N

E =

C6N E 3N

donde n (R) es el vol


umen de la hiperesfera en n dimensiones definida en la seccion 5.2.1. Usando
la Ec.(5.28) y la aproximacion de Stirling tenemos en el lmite termodinamico

s = S/N =

kB
(E)
ln
N
h3N

3kB 1 + ln

u
3
h

(5.47)

y por lo tanto
1
s
3kB
=
=
T
u
u

o u = 3kB T

de donde se deriva la ley de Dulong y Petit: c = 3kB . Vemos as que el modelo clasico reproduce el
lmite de altas temperaturas de su correspondiente modelo cuantico. Como veremos a lo largo del
curso, esta es una propiedad absolutamente general.
Notemos que la energa interna (y por lo tanto el calor especfico) es totalmente independiente
de las caractersticas de los osciladores (masa y frecuencia). Siguiendo los pasos anteriores, es facil
demostrar entonces que para un Hamiltoniano clasico

61

H=

fN
X

[Ai p2i + Bi qi2 ]

i=1

la energa por partcula resulta


u = f kB T
Cada grado de libertad armonico en el Hamiltoniano contribuye con 21 kB T a la energa. Esto se
conoce como Teorema de equipartici
on de la energa.

5.3.

La formulaci
on de Gibbs

J. Gibbs propuso una expresion para la entropa alternativa a la de Boltzmann que, si bien
enteramente equivalente a la anterior, permite formular la teora en base a un principio variacional.
Mas alla de la elegancia de este tipo de formulaci
on, veremos que la misma permite extender
de manera simple los resultados del ensemble microcanonico (sistema aislado) a situaciones mas
generales (sistemas no aislados). Supongamos un sistema en equilibrio, con lo cual la probabilidad
de encontrarlo en un dado microestado esta descripta por una probabilidad independiente del
tiempo, la cual podemos asumir (en base al Teorema de Liouville) una funcion del Hamiltoniano.
La entropa de Gibbs tiene la forma
S = kB hln(C)i

(5.48)

donde es la densidad de probabilidad en equilibrio (en el caso clasico) o el operador densidad (en
el caso cuantico) y C es una constante que vale C = 1 en el caso cuantico y C = h3N en el caso
clasico. El promedio en la expresion anterior es un promedio en ensemble, es decir que se calcula
con la misma . As, en el caso clasico tenemos que
Z

S = kB

(p, q) ln[h3N (p, q)] dp dq

(5.49)

donde la integral se extiende a todo el espacio de las fases; en el caso cuantico tenemos
S = kB Tr [
ln ]

(5.50)

o en la base en que es diagonal


S = kB

nn ln nn

(5.51)

donde n indexa un conjunto completo de n


umeros cuanticos. Dado que 0 nn 1, la entropa
definida de esta manera es S 0. Esta entropa puede pensarse como una funcional de . Diferentes
elecciones de daran lugar a diferentes valores de la entropa. Por ejemplo, podramos considerar un
estado totalmente ordenado, esto es un macroestado en el cual el sistema puede encontrarse en un
u
nico microestado n0 (esto se denomina un estado cuantico puro). En ese caso, la probabilidad debe
ser igual a uno para dicho microestado y cero para los demas. Tomando entonces el lmite nn 0
para todo estado n 6= n0 (con lo cual n0 n0 1) tenemos que S = 0 para este macroestado. En el
caso clasico es mas delicado hacer este computo, ya que involucra deltas de Dirac, pero podemos
pensar que partimos el espacio de las fases en vol
umenes mnimos de tama
no h3N , con lo cual se
reduce al calculo anterior. Dado que la entropa de Gibbs es definida no negativa, un estado puro
tiene entropa mnima .

62
Vamos a postular que la densidad de probabilidad (u operador densidad) que describe los
estados de equilibrio del sistema es aquella que maximiza la entropa de Gibbs, compatible con
los vnculos macroscopicos del sistema. A estos vnculos, debemos a
nadir siempre la condicion de
normalizacion
Z

(p, q) dp dq = 1

(5.52)

o
Tr = 1

(5.53)

Para un sistema aislado, los vnculos son que E, V y N son constantes y por lo tanto debe anularse para cualquier microestado que no cumpla estas condiciones. Calculemos entonces el maximo
de S sujeto a la condicion de normalizacion, la cual podemos imponer introduciendo un multiplicador de Lagrange que llamaremos 0 . Veamos el caso clasico. La condicion de extremo se obtiene
pidiendo que la variacion

S[] 0

dp dq = 0

(5.54)

para variaciones peque


nas arbitrarias , donde las integrales se llevan a cabo en la cascara E
H(p, q) E + . Tenemos

S[] 0

dp dq

S[ + ] 0
Z

= kB

( + ) dp dq S[] 0

dp dq

( + ) ln[h3N ( + )] ln[h3N ] dp dq 0

dp dq

Desarrollando el integrando de la primera integral a primer orden en y despreciando las variaciones de orden superior:
Z

kB kB ln[h3N ] 0 dp dq = 0

Dado que las variaciones son arbitrarias obtenemos


=

1
h3N

e(0 /kB +1) = cte

(5.55)

El multiplicador de Lagrange se obtiene de reemplazar la expresion anterior en la condicion de


normalizacion (5.52) de donde = 1/(E) para E H(p, q) E + . Analizando las variaciones
a segundo orden es posible mostrar que este extremo es efectivamente un maximo.
La distribucion equiprobable es la que maximiza la entropa de Gibbs para un sistema aislado.
Si reemplazamos en la ecuacion (5.49) obtenemos la entropa de Boltzmann Ec.(5.2).

5.4.

Ejercicios

1. Demuestre que las definiciones (5.16)-(5.18) son equivalentes en el lmite termodinamico.


2. Obtenga el operador densidad cuantico a partir del principio variacional de Gibbs para un
sistema aislado. Calcule la expresion final de la entropa de Gibbs. Ayuda: trabaje en la base
en que es diagonal.
de autoestados de H

Captulo 6

El ensemble can
onico
En el formalismo termodinamico es posible trabajar en diferentes representaciones (mediante la
transformada de Legendre) las cuales, dependiendo de las circunstancias, resultan mas convenientes
que la representacion entropa. De la misma manera, en la Mecanica Estadstica es posible utilizar
otros ensembles diferentes del microcanonico, caracterizados por diferentes parametros macroscopicos.

6.1.

Densidad de probabilidad: la funci


on partici
on

Consideremos el caso de un sistema simple con vol


umen V y n
umero de partculas N en equilibrio
con un reservorio termico a temperatura T , con el cual puede intercambiar calor pero no trabajo.
Nos preguntamos entonces cual es la densidad de probabilidad para un dado microestado. Dado
que el sistema no esta aislado, su energa no es constante y fluct
ua (puede intercambiar energa con
el reservorio). Pero dado que el sistema esta en equilibrio, podemos asumir que, para un dado valor
de la temperatura del reservorio, el valor medio de su energa esta fijo en
=
U = hEi = Tr(
H)

nn En

(6.1)

donde n representa un conjunto de n


umeros cuanticos que indexa una base de autoestados del
Hamiltoniano de N partculas y En son los correspondientes autovalores. Podemos encontrar la
densidad de probabilidad aplicando el principio variacional de Gibbs que enunciamos el captulo
pasado. Para ello debemos maximizar la entropa de Gibbs
S = kB Tr(
ln ) = kB

nn ln nn

(6.2)

sujeta al vnculo (6.1) y a la normalizacion


Tr =

nn = 1.

(6.3)

Introduciendo dos multiplicadores de Lagrange 0 y 1 asociados a cada vnculo tenemos


h

kB ln )
Tr(0 + 1 H

(0 nn + 1 nn En kB nn ln nn )

[(0 kB ) + 1 En kB ln nn ] nn = 0

(6.4)

a primer orden en las variaciones nn . Para variaciones arbitrarias nn esto nos lleva a la condicion
63

64

(0 kB ) + 1 En kB ln nn = 0

(6.5)

o bien

nn = exp

0
1
1 +
En
kB
kB

(6.6)

El multiplicador de Lagrange 0 puede eliminarse aplicando la condicion de normalizacion (6.3):

0
1
exp
1
exp
En = 1.
kB
kB
n

Definiendo la funci
on partici
on

ZN (1 ) exp 1

0
kB

exp

En = Tr e1 H/kB
kB

(6.7)

tenemos
nn =

e1 En /kB
e1 En /kB
= P E /k
1 n
B
ZN (1 )
ne

(6.8)

A continuacion determinamos el multiplicador 1 . Para ello multiplicamos la Ec.(6.5) por nn


y sumamos sobre n:
(0 kB ) + 1 U + S = 0

(6.9)

kB ln[ZN (1 )] + 1 U + S = 0

(6.10)

Recordemos que para un sistema simple a temperatura constante con vol


umen y n
umero de
partculas constantes la representacion termodinamica natural es la de Helmholtz, en la cual la
relacion fundamental es F = F (T, V, N ); la energa libre de Helmholtz satisface la relacion: F
U + T S = 0. La comparacion con la Ec.(6.10) nos sugiere la identificaci
on 1 = 1/T y
F (T, V, N ) = kB T ln[ZN (T )]

(6.11)

La funcion particion toma entonces la forma

ZN (T ) = eF = Tr e H

(6.12)

donde

1
kB T

(6.13)

El operador densidad resulta entonces

e H

Tr e H

(6.14)

El ensemble definido por la densidad de probabilidad (6.14) se conoce como ensemble can
onico.
Veremos en breve la consistencia de esta eleccion. Notemos que la energa libre F se expresa en
terminos de la funcion particion. Dado que la forma funcional F = F (T, V, N ) es una relacion
fundamental, vemos entonces que toda la informacion termodinamica esta contenida en la funcion
particion.

65
La derivacion en el caso clasico es enteramente analoga a la anterior (queda como ejercicio para
el lector) y da como resultado
(p, q) =

eH(p,q)
ZN (T )

(6.15)

con
ZN (T ) = e

eH(p,q) dp dq

h3N

(6.16)

donde la integral se extiende ahora a todo el espacio de las fases correspondiente a un sistema con
V y N fijos.

6.2.

Densidad de estados

Consideremos la integral en el espacio de las fases de una funcion arbitraria f que depende de
(p, q)) a traves del Hamiltoniano
I=

f [H(p, q)] dp dq

h3N

La misma puede escribirse como


I=

Z
0

f (E) g(E) dE

donde
Z

g(E) =

H(p,q)=E

dp dq/h3N

(6.17)

se conoce como densidad de estados; g(E) dE nos da el n


umero de estados con energa entre
E y E + dE. Si en particular elegimos f (H) = (E H), donde (x) es la funcion escalon de
Heaviside, tenemos
I = (E)/h3N =

Z E
0

g(E 0 ) dE 0

de donde
1 (E)
(E)
= 3N = eSm (E)/kB
(6.18)
E
h
donde Sm (E) es la entropa microcanonica correspondiente a una energa E. Tenemos por lo tanto
que
g(E) =

h3N

ZN (T ) =

Z
0

e E g(E) dE

(6.19)

En el caso cuantico podemos escribir


ZN (T ) =

e En

(6.20)

donde el ndice n simboliza un conjunto completo de n


umeros cuanticos, esto es, la suma corre
sobre todos los posibles autoestados del Hamiltoniano del sistema y En son los correspondientes
autovalores. Para un sistema finito el espectro es discreto y podemos escribir

66

ZN (T ) =

g 0 (E) e E

(6.21)

donde, a diferencia de la suma en la Ec.(6.20), esta suma corre sobre todos los autovalores diferentes E del Hamiltoniano y g 0 (E) es la degeneracion del autovalor E. En muchos casos se observa
que, en el lmite termodinamico, el espectro se vuelve denso, de manera que la suma (6.21) converge
a una integral del tipo (6.19). As, podemos asumir esa expresion en general. Veamos un ejemplo.
Consideremos una partcula libre encerrada en una caja c
ubica de dimension L, de manera que
V = L3 . Supongamos que las paredes son perfectamente rgidas, de manera que la funcion de onda
debe anularse en las mismas. El Hamiltoniano de este sistema es
2
= p
H
2m

donde p (
px , py , pz ) es el operador momento lineal de la partcula. Sea ~k un autoestado ortonorD E

on coordenada
malizado del operador vector de onda k = p/
h, con ~k ~k 0 = ~ ~ 0 . En la representaci
k,k

tenemos

E
nx x
h~r| ~k = nx ,ny ,nz (x, y, z) = A sin
L

ny y
sin
L

nz z
sin
L

(6.22)

donde A es una constante de normalizacion y nx , ny , nz son enteros 1, 2, . . . , , Los autovalores


permitidos del operador vector de onda k son
~k = nx i + ny j + nz k
L
L
L
donde i, j y k son vectores unitarios en las direcciones x, y, z respectivamente.
Podemos calcular entonces la funcion particion de una partcula1 Z1 (T ). La misma viene dada
por

Z1 (T ) = Tr1 e

p2 /2m

E
X D
~k eh2 k2 /2m ~k 0 =
=

~k

e E(k)

(6.23)

kx =/L ky =/L kz =/L

donde los autovalores de la energa son


2 |~k|2
h
E(~k) =
2m

(6.24)

Cada una de las sumas en la Ec.(6.23) corre sobre variables que cambian en una cantidad ki = /L
con i = x, y, z. Podemos reescribir
V
Z1 (T ) = 3

eE(k) ky kx kz

(6.25)

kx =/L ky =/L kz =/L

En el lmite de vol
umen infinito L , ki 0 y las sumas de la ecuacion anterior convergen
a una integral de Riemann, de manera que para L 1 podemos aproximar
1

Esto puede parece un poco extra


no, ya que en general estamos interesados en el comportamiento de 1023
partculas. Sin embargo, mas all
a del ejercicio te
orico que representa esta c
alculo, veremos mas adelante que la
funci
on partici
on de un gas ideal puede expresarse en terminos de Z1 .

67

V
dk
dk
dkz eE(k)
x
y
3 0
0
0
Z
Z
Z
V
dkx
dky
dkz e E(k)
(2)3

Z
4V
k 2 eE(k) dk
(2)3 0

Z1 (T )
=
=

donde k = |~k|. Haciendo el cambio de variables k =


Z

Z1 (T ) =

(6.26)
(6.27)

2mE/
h obtenemos finalmente

g(E) eE dE

(6.28)

donde la densidad de estados g(E) resulta:

V
3/2
(2m)
g(E) = 2
E
h3

(6.29)

Esta expresion puede interpretarse facilmente como sigue. Los estados accesibles del sistema se
encuentran distribuidos en los nodos una grilla c
ubica en el espacio (kx , ky , kz ). El n
umero de
estados con energa entre E y E + dE corresponde al n
umero de nodos en dicho espacioubicados
en un octante de la cascara encerrada entre las esferas de radio R y R + dR con R = 2mE/
h.
Podemos estimar dicho n
umero dividiendo el vol
umen
de la cascara por el vol
umen asociado a cada
h es
nodo (/L)3 . El vol
umen de una esfera de radio R = 2mE/
(E) =

4 (2m)3/2 3/2
E
3
h3

y el vol
umen de la cascara
(E + dE) (E) =

d(E)
(2m)3/2 1/2
E dE
dE = 2
dE
h3

Dividiendo por (2/L)3 (el factor 23 = 8 viene porque consideramos un octante de la cascara) se
obtiene la Ec.(6.29).
Finalmente, podemos integrar y obtener la funcion particion
Z1 (T ) =

V
3T

(6.30)

donde
h
T =
2mkB T

(6.31)

se conoce como longitud de onda termica (esta cantidad tiene dimensiones de longitud). Veremos
que constituye una magnitud importante en la descripcion de los gases ideales, ya que puede verse
que la misma es del orden de la longitud de onda de de Broglie para una partcula de masa m con
energa kB T .
Notemos que, de la Ec.(6.26), haciendo el cambio de variables p = hk, obtenemos
Z1 (T ) =

V
h3

e(px +py +pz )/2m dpx dpy dpz

que corresponde exactamente a la funcion particion de una partcula clasica.

(6.32)

68

6.2.1.

Ejercicios

1. Muestre que la densidad de estados y la funcion de particion de una partcula en una caja con
condiciones de contorno periodicas resultan identicas a las obtenidas con paredes reflectantes
en el lmite V 1.
2. Calcule la densidad de estados para una partcula y la funcion particion Z1 (T ) en una y dos
dimensiones.

6.3.

El gas ideal cl
asico en el ensemble can
onico

La funcion particion para el gas ideal clasico viene dada por

ZN (T ) =

dq

h3N

"

dp exp

3N
X
1
i=1

2m

p2i

V
h3

N Y
3N Z

i=1

epi /2m dpi

(6.33)

Notemos que

ZN (T ) =

V
h3

N Z

(p2x +p2y +p2z )/2m

dpx dpy dpz

Z1N (T )

V
T

(6.34)

donde hemos usado la Ec.(6.32). De las Ecs.(6.30) y (6.31) tenemos entonces

F = kB T N ln Z1 (T ) = kB T N ln

V
(2mkB T )3/2
h3

(6.35)

Notemos que si multiplicamos V y N por un factor , F (T, V, N ) 6= F (T, V, N ). Este es


el mismo problema que encontramos en el ensemble microcanonico y la solucion es la misma.
Para descontar el contaje de m
ultiples configuraciones equivalentes de partculas indistinguibles,
debemos dividir la densidad de estados por N !. De la Ec.(6.19), esto resulta equivalente a reemplazar
ZN (T ) ZN (T )/N !, con lo cual

F = kB T N ln

V
(2mkB T )3/2 kB T N
N h3

(6.36)

La entropa resulta

F
V
5
S=
= kB N ln
(2mkB T )3/2 +
3
T
Nh
2

(6.37)

y la energa interna
U = F + TS =

3
N kB T
2

(6.38)

Reemplazando la Ec.(6.38) en la Ec.(6.37) recuperamos la formula de Sakkur y Tetrode


"

V
S(U, V, N ) = N kB ln
N

U
N

3/2 #

3
+ N kB
2

5
4 m
+ ln
3
3h2

esto es, exactamente el mismo resultado obtenido en el ensemble microcanonico.

69

6.4.

Algunas propiedades generales del ensemble can


onico

Como hemos visto hasta ahora, el formalismo general puede ser desarrollado en forma completamente analoga en los casos clasico y cuantico. Para evitar de aqu en mas duplicar los calculos,
vamos a adoptar la siguiente nomenclatura:
ZN (T ) = Tr eH

(6.39)

donde el smbolo Tr va a denotar suma sobre todos los microestados compatibles con los vnculos
del sistema, esto es, una autentica traza de operadores definidos en
un espacio de Hilbert apropiado
R
en el caso cuantico o una integral en el espacio de las fases . . . dpdq/h3N en el clasico. Los
smbolos y H podran denotar tanto operadores como funciones de (p, q). Salvo que lo indiquemos
explcitamente, todos los calculos con esta notacion seran aplicables tanto al caso cuantico como al
puede expresarse como
clasico. As, el promedio de cualquier observable en el ensemble canonico O
>=
<O

h
i
1
eH
Tr O
ZN

(6.40)

Por ejemplo, la energa interna U = hHi resulta


U = hHi =

h
i
1
Tr H eH ,
ZN

(6.41)

la cual puede ser escrita como


U =

(F )
ln ZN
=

(6.42)

Otras ecuaciones de estado (por ejemplo, para la presion o la entropa) se obtienen directamente a
partir derivar la relacion fundamental F = kB T ln ZN . Sin embargo, el formalismo de la Mecanica
Estadstica no se limita a una receta para calcular relaciones fundamentales. Podemos tambien
obtener diversos tipos de informacion microscopica. Consideremos, por ejemplo, el calor especfico
(en el caso de un sistema simple sera el calor especfico a vol
umen constante):
c=

kB 2 U
1 U
=
N T
N

(6.43)

Derivando la Ec.(6.41) y usando la definicion (6.39)


U

h
i
h
i
1 ZN
1
H
2 H
Tr
H
e

Tr
H
e
2
ZN
ZN
h
i
D E
1 ln ZN
=
Tr H eH H 2
ZN

= hHi2 H 2

Y as

E
kB 2 D 2 E
kB 2 D
H hHi2 =
(H hHi)2
(6.44)
N
N
El calor especfico es proporcional a las fluctuaciones de energa del sistema. Recordemos que el calor
especfico nos da la respuesta del sistema (cantidad de calor absorbida o entregada) ante un cambio
infinitesimal de temperatura. Vemos entonces que la respuesta termica del sistema esta regulada por
las fluctuaciones de energa. Como veremos a lo largo del curso, esta es una caracterstica general:
la respuesta del sistema ante perturbaciones externas peque
nas esta regulada por las fluctuaciones

c=

70
en equilibrio de alguna magnitud relacionada. La relacion (6.44) no solo es de gran importancia
conceptual, sino tambien de gran utilidad en los metodos de simulaciones numericas en Mecanica
Estadstica.

6.5.

Fluctuaciones de energa y equivalencia entre los ensembles


can
onico y microcan
onico.

En el ensemble canonico la energa del sistema no es constante y por lo tanto pueden esperarse
fluctuaciones respecto del valor medio U = hHi. Vamos a analizar las propiedades estadsticas de
dichas fluctuaciones.
Definamos la variable aleatoria U (H U )/U que nos da la intensidad relativa de la fluctuacion. Claramente hU i = 0. De la Ec.(6.44) tenemos que
D

(U )2 =

cN
kB 2 U 2

(6.45)

Dado que c es una variable intensiva y que U N , tenemos que el desvo estandar de las fluctuaciones relativas decae a cero como
q

1
h(U )2 i
N

En el lmite termodinamico N las fluctuaciones relativas de la energa van a cero, lo


que significa que, si bien pueden esperarse fluctuaciones en terminos absolutos, las variaciones de
energa esperables son despreciables comparadas con el valor medio. En otras palabras, si bien el
sistema puede acceder en principio a cualquier valor de energa, la probabilidad de que adopte un
valor significativamente diferente de U tiende a cero en el lmite termodinamico. Veamos esto en
mayor detalle.
La probabilidad de que el sistema tenga una energa E en el ensemble canonico viene dada por

P (E) =

R
0

R
0

R
0

g(E) e E
e E g(E) dE
e E+ln g(E)
e E+ln g(E) dE
e[T Sm (E)E]
e[T Sm (E)E] dE

(6.46)

donde Sm (E) es la entropa microcanonica para una energa E. El promedio en ensemble de una
funcion arbitraria de la energa f (E) esta dado por
R

hf (E)i =

f (E) e[T Sm (E)E] dE


[T Sm (E)E] dE
0 e

(6.47)

Analicemos el exponente en estas integrales. La entropa microcanonica es una funcion creciente


de E y concava (ya que asumimos que el sistema es estable termodinamicamente). Para valores
peque
nos de E el exponente es creciente, pero tarde o temprano el termino lineal E domina y el
mismo se vuelve decreciente. Por lo tanto, el exponente presenta un maximo para alg
un valor de
E = E, el cual satisface las condiciones

Sm (E)
=1
E E=E

(6.48)

71

2 Sm (E)
<0

E 2 E=E

(6.49)

La primera condicion nos dice que E corresponde a la energa interna que obtendramos en el ensemble microcanonico correspondiente a una temperatura T y por lo tanto es proporcional a N . As,
en el lmite termodinamico las integrales estan dominadas por la contribuci
on en las inmediaciones
del maximo de dicho esponente, ya que la funcion exponencial decae muy rapido al alejarnos de el.
Si desarrollamos el exponente en potencias de E E:
1
[T Sm (E) E] = [T Sm (E) E] A(E E)2 +
2
vemos que P (E) tiende a una distribucion gaussiana
2 /2

P (E) = R
0

e A(EE)

(6.50)

e A(EE)2 /2 dE

donde

2 Sm (E)
A = T

E 2 E=E
De aqui, promediando E resulta inmediato que U = E. Cambiando de variable en la Ec.(6.50),
vemos que las fluctuaciones U tienen una distribucion gaussiana
P (U ) e(U )

2 /2 2

(6.51)

donde la variancia
D

= (U )

1
kB
=
= 2
2
AU
U

"

#1

1
cN T 2

2 Sm (E)

E 2 E=U

De la Ec.(6.48) tenemos que

2 Sm (E)
1
1 T
= 2
= 2

E
T U
T
E=U

U
T

(6.52)

de donde recuperamos la Ec.(6.45).


Finalmente notemos que U T Sm = Fm es por definicion la energa libre de Helmholtz microcanonica. Por otra parte, la energa libre canonica la hemos definido como ZN (T ) = eF . A partir
de los resultados anteriores, tenemos que
ZN (T ) = e
Z
(EU )2

2k cN T 2
0

dE =

2k
U

=e

x2

B cN T

Fm

Z
(EU )2

2k cN T 2
0

dx

2k

dE

x2

B cN T

dx =

(6.53)
p

2kB cN T 2

y as

Dado que Fm

1
F Fm kB T ln(N )
2
N , el u
ltimo termino es despreciable en el lmite termodinamico.

(6.54)

72
Resumiendo: hemos visto que en el lmite termodinamico las fluctuaciones de energa respecto
del valor de equilibrio
U tienen una distribucion de probabilidad gaussiana cuyo ancho tiende a

cero como 1/ N ; para N la distribucion gaussiana tiende a una delta de Dirac, con lo cual
los microestados con probabilidad no nula tienen todos practicamente la misma energa. En dicho
lmite, las funciones termodinamicas (entropa, energa libre) obtenidas en ambos ensembles dan
el mismo resultado, a menos de una correccion despreciable (crece como ln N , mientras que las
funciones termodinamicas crecen como N ).
Podemos entender mejor lo anterior como sigue. En el ensemble canonico la probabilidad de un
dado microestado es eH , con lo cual decae exponencialmente rapido con la energa del estado,
ya que la misma crece como N . Sin embargo, cuando consideramos la probabilidad de medir una
dada energa E, debemos multiplicar el factor anterior por el n
umero de microestados con dicha
energa, esto es, por la densidad de estados. La densidad de estados nos da una medida del tama
no
de la superficie energa, la cual a su vez cerce exponencialmente con N . As, para alguna energa
intermedia estos dos efectos se compensan, dando lugar a una probabilidad finita. Para una dada
temperatura, la energa donde eso ocurre corresponde al mnimo de la energa libre microcanonica
F = E T Sm (E).

6.6.

Sistemas de partculas indistinguibles

Como ya mencionamos, del principio de incerteza resulta que partculas identicas en Mecanica
Cuantica son indistinguibles, a menos que exista una situacion particular que limite sus posiciones
espaciales (por ejemplo, atomos que estan asociados a los sitios de un cristal), permitiendo identificarlas de manera individual.
La propiedad de indistinguibilidad esta relacionada con el hecho de que el Hamiltoniano de
N partculas, as como otros observables, resultan invariantes ante permutaciones de las variables
dinamicas asociadas a diferentes partculas, es decir, ante una renumeraci
on de las mismas. Por
ejemplo, en situaciones bastante generales podemos describir un sistema de partculas a traves de
un Hamiltoniano que contiene un termino de energa cinetica y un potencial de interacci
on de pares
N =
H

N
X
p2i
i=1

2m

N (N 1)/2

V (
qi , qj , si , sj )

(6.55)

i<j=1

donde pi , qi y si son los operadores momento, posicion y spin de la partcula i-esima y donde la
energa potencial V resulta invariante ante el intercambio simult
aneo de las variables dinamicas de
cualquier par de partculas i y j.
Sabemos que por cada operacion de simetra en Mecanica Cuantica existe un operador asociado,
y por lo tanto puede ser diagonalizado simultaneamente. Existira por
el cual conmuta con H
lo tanto un conjunto de operadores asociados a la operacion de cambiar la enumeraci
on de las
partculas, el cual particiona el espacio de Hilbert en diferentes subespacios cada uno caracterizado
por un conjunto diferente de autovalores de dichos operadores. Veremos a continuaci
on que existen
u
nicamente dos autovalores posibles asociados a la operacion de permutaci
on de partculas. Dichos
autovalores constituyen cantidades conservadas y por lo tanto imponen un nuevo vnculo a los
microestados accesibles de un sistema. En otras palabras, para un dado sistema de partculas
indistinguibles, la matriz densidad de probabilidad solo tendra elementos no nulos en uno de dichos
subespacios.

6.6.1.

Simetra de la funci
on de onda de partculas indistinguibles

Supongamos por simplicidad partculas sin spin. El estado de un sistema de N partculas esta
descripto por una funcion de onda (q1 , . . . , qN ), donde qi denota el vector posicion de la partcula
iesima.

73
Cambios en la enumeracion de las partculas pueden describirse definiendo los operadores permutacion de pares Pik , los cuales intercambian las coordenadas qi y qj en la funcion de onda
Pik (q1 , . . . , qi , . . . , qk , . . . , qN ) = (q1 , . . . , qk , . . . , qi , . . . , qN )

(6.56)

Si el Hamiltoniano es invariante ante el cambio en la enumeraci


on de todas las partculas, se
cumple que
Pik ] = 0 i, k = 1, . . . , N con i 6= k
[H,
Las autofunciones de Pik tienen que satisfacer
Pik (q1 , . . . , qi , . . . , qk , . . . , qN ) = (q1 , . . . , qi , . . . , qk , . . . , qN )
(q1 , . . . , qk , . . . , qi , . . . , qN ) = (q1 , . . . , qi , . . . , qk , . . . , qN )

(6.57)

donde es un autovalor de Pik . Si volvemos a aplicar el operador Pik en la Ec.(6.57) encontramos


2
Pik
(q1 , . . . , qi , . . . , qk , . . . , qN ) = (q1 , . . . , qi , . . . , qk , . . . , qN ) = 2 (q1 , . . . , qi , . . . , qk , . . . , qN )

esto es, los autovalores de Pik son tales que 2 = 1; por lo tanto, solo hay dos posibilidades: = +1,
con lo cual la autofuncion es simetrica respecto al intercambio de las coordenadas i y j, o = 1
en cuyo caso la funcion de onda es antisimetrica.
Si el Hamiltoniano conmuta con todos los operadores de permutaci
on, entonces sus autofunciones pueden ser construidas de manera que sean totalmente simetricas (esto es, simetricas ante
cualquier permutacion de coordenadas) o totalmente antisimetricas. Una generalizacion del operador permutacion de pares es el operador P , que genera una permutaci
on arbitraria de ndices
P (q1 , q2 , . . . , qN ) = (qP1 , qP2 , . . . , qPN )

(6.58)

donde P1 , . . . , PN es una permutacion de los n


umeros 1, . . . , N (en realidad, tenemos un operador
diferente para cada permutacion). Cualquiera de dichas permutaciones se obtiene mediante una
secuencia de permutaciones de pares de ndices, de manera que el operador P resulta de la aplicacion
sucesiva de un cierto conjunto de operadores Pik . Por lo tanto, las autofunciones de P tanbien son
las funciones simetricas o antisimetricas. Si el n
umero de permutaciones de pares necesarias para
construir P1 , . . . , PN es par (impar) diremos que la permutaci
on es par (impar).
Si uno comienza con una autofuncion del Hamiltoniano arbitraria (q1 , . . . , qN ) sin ninguna
simetra de paridad, uno puede construir autofunciones completamente simetricas o antisimetricas
va
S (q1 , . . . , qN ) = BS

P (q1 , . . . , qN )

(6.59)

(1)P P (q1 , . . . , qN )

(6.60)

A (q1 , . . . , qN ) = BA

X
P

donde BS , BA son constantes de normalizacion y las sumas corren sobre todas las posibles permutaciones de los ndices 1, . . . , N . El signo (1)P es +1 si la permutaci
on es par y 1 si la permutaci
on
es impar. Por ejemplo, para una funcion de onda de tres partculas tenemos
S (q1 , q2 , q3 ) = BS [(q1 , q2 , q3 ) + (q2 , q1 , q3 ) + (q1 , q3 , q2 ) + (q3 , q2 , q1 )
+ (q2 , q3 , q1 ) + (q3 , q1 , q2 )]
A

(q1 , q2 , q3 ) = BA [(q1 , q2 , q3 ) (q2 , q1 , q3 ) (q1 , q3 , q2 ) (q3 , q2 , q1 )


+ (q2 , q3 , q1 ) + (q3 , q1 , q2 )]

74
Es un hecho experimental que los sistemas de partculas en la naturaleza solo pueden ser descriptos por funciones de onda de simetra bien definida. Mas a
un, se observa que partculas de una
misma especie (electrones, muones, fotones, quarks, etc) solo pueden presentar un u
nico tipo de
simetra ante intercambio. En otras palabras, solo existen dos tipos de partculas. Aquellas descriptas por funciones de onda simetricas se denominan bosones en honor al fsico ind
u Satyendranath
Bose, quien en 1924 propuso esta propiedad para los fotones. Poco tiempo despues Albert Einstein
aplico el mismo concepto a un gas ideal monoatomico. Partculas descriptas por funciones de onda
antisimetricas se denominan fermiones en honor al fsico italiano Enrico Fermi.
Se observa tambien que estas propiedades estan directamente relacionadas al spin de las partculas. Partculas con spin semientero son siempre fermiones (ej., electrones), mientras que partculas
con spin entero (ej., fotones) son siempre bosones. La relacion entre el spin y la simetra de intercambio de las partculas es un hecho a
un no bien comprendido y objeto de debate, de manera que
lo asumiremos como un postulado.
Estas propiedades tienen una profunda influencia en la descripcion mecanico-estadstica ya que
los microestados accesibles del sistema deben hallarse exclusivamente en subespacios de estados
simetricos o antisimetricos, dependiendo del tipo de partcula. Como veremos, esto lleva a comportamientos radicalmente diferentes. Se dice entonces que los bosones obedecen la estadstica de
Bose-Einstein, mientras que los fermiones obedecen la estadstica de Fermi-Dirac.

6.6.2.

Funci
on de onda de muchas partculas

Para avanzar mas en la teora debemos entonces elegir una base de autoestados del Hamiltoniano, sobre la cual podamos construir conjuntos de estados simetricos o antisimetricos. Esto resulta
particularmente sencillo en el caso de partculas no interactuantes, esto es, cuando el Hamiltoniano
puede expresarse como la suma de operadores de una partcula:
q1 , . . . , qN , p1 , . . . , pN ) =
H(

N
X

qi , pi )
h(

i=1

Si tenemos resuelto el problema de autovalores de una partcula


k (q) = k k (q)
h
donde k denota un conjunto completo de n
umeros cuanticos, podemos construir un autoestado de
como
H
E
k1 ,...,kN (q1 , . . . , qN ) =

N
Y

ki (qi )

(6.61)

i=1

correspondiente a un autovalor de H
E=

N
X

ki

i=1

La funcion de onda (6.61) puede ser expresada mas claramente en la notacion de Dirac. Sea |ki
el vector de estado de una partcula correspondiente al autovalor k, esto es, ki (qi ) = hqi |ki i. El
vector de estado de N partculas es el producto directo de los vectores de estado de una partcula
|k1 , . . . , kN i = |k1 i |k2 i . . . |kN i

(6.62)

La Ec.(6.62) significa que la partcula 1 se encuentra en el estado k1 , la partcula 2 en el estado k2 ,


etc. El vector hermitiano conjugado (bra) resulta

75

hk1 , . . . , kN | = hkN | hkN 1 | . . . hk1 |

(6.63)

Si los estados de una partcula esta ortonormalizados hk |k 0 i = k,k0 y forman un conjunto completo
X

|ki hk| = 1

las mismas propiedades se cumplen para los autoestados (6.62) en el espacio suma directa:
0
0
k1 , . . . , kN
|k1 , . . . , kN i =

0 0
kN kN 1 . . . k10 |k1 i |k2 i . . . |kN i
0
0

k1 |k1 i kN |kN i

0
= k1 ,k10 kN ,kN

(6.64)

|k1 , . . . , kN i hk1 , . . . , kN | = 1

(6.65)

k1 ,...,kN

En ese caso, cualquier funcion de onda arbitraria (a


un para partculas interactuantes) puede ser
desarrollada en terminos de los estados |k1 , . . . , kN i. En la representaci
on coordenada, la funcion
de onda resulta
E
k1 ,...,kN (q1 , . . . , qN ) = hq1 , . . . , qN |k1 , . . . , kN i = k1 (q1 ) k2 (q2 ) kN (qN )

(6.66)

Esta funcion de onda no tiene simetra de paridad definida, ya que el intercambio de dos coordenadas (o equivalentemente de dos n
umeros cuanticos) lleva a un nuevo autoestado completamente
diferente. Autoestados simetricos y antisimetricos pueden construirse a partir de las Ecs.(6.59)(6.60):
E,S
k1 ,...,kN (q1 , . . . , qN ) = BS
E,A
k1 ,...,kN (q1 , . . . , qN ) = BA

P k1 (q1 ) kN (qN )

(6.67)

(1)P P k1 (q1 ) kN (qN )

(6.68)

X
P

Aqu las sumas corren sobre todas las permutaciones P1 , . . . , PN de los argumentos q1 , . . . , qN de
las autofunciones de una partcula kn (qn ). Sin embargo, es claro que da exactamente lo mismo
permutar los ndices de las coordenadas o los ndices de los n
umeros cuanticos. Podemos entonces
expresar
|k1 , . . . , kN iS = BS

P |k1 , . . . , kN i

(6.69)

(1)P P |k1 , . . . , kN i

(6.70)

|k1 , . . . , kN iA = BA

X
P

donde ahora las sumas corren sobre permutaciones de los n


umeros cuanticos.
La funcion de onda antisimetrica puede expresarse como el determinante de una matriz

k1 (q1 ) k1 (qN )

E,A
..
..
k1 ,...,kN (q1 , . . . , qN ) = BA det

.
.
kN (q1 ) kN (qN )

(6.71)

76
(recordemos la propiedad de los determinantes de cambiar de signo ante una permutaci
on de dos
cualesquiera de sus filas o columnas, lo cual en este caso corresponde a permutar dos coordenadas
o dos n
umeros cuanticos). De aqui resulta inmediato que la funcion de onda antisimetrica se anula
si dos partculas estan en el mismo estado cuantico, ya que en ese caso la matriz tiene dos filas
identicas. Esto es precisamente el enunciado del Principio de Exclusi
on de Pauli: dos fermiones
identicos no pueden ocupar simultaneamente el mismo estado cuantico. La probabilidad de que
esto u
ltimo ocurra (dada por el modulo al cuadrado de la funcion de onda) es cero.
Las funciones de onda antisimetricas por lo tanto resultan la combinaci
on de productos de todas
la posibles permutaciones de N ndices diferentes y la normalizacion resulta
A

2
hk1 , . . . , kN |k1 , . . . , kN iA = BA
N! = 1

As, arribamos a la expresion

k1 (q1 ) k1 (qN )
1

E,A
..
..
det
k1 ,...,kN (q1 , . . . , qN ) =

.
.
N!
kN (q1 ) kN (qN )

(6.72)

conocida como determinante de Slater.


En el caso de las funciones de onda simetricas los n
umeros cuanticos pueden repetirse. Esto es, un
n
umero arbitrario de bosones pueden ocupar un mismo estado de una partcula. La normalizacion
en este caso viene dada por
S

hk1 , . . . , kN |k1 , . . . , kN iS = BS2

XXD
P

= BS2 N !

P0

kP10 , . . . , kPN0 |kP1 , . . . , kPN i

hk1 , . . . , kN |kP1 , . . . , kPN i

= BS2 N !

X
P

k1 ,kP1 kN ,kPN = 1

(6.73)

Dado que ahora puede haber n


umeros cuanticos repetidos, el n
umero de terminos no nulos en
la u
ltima suma va a depender de cuantos ndices se repitan. Podemos describir esto de manera
P
general, introduciendo los n
umeros de ocupacion nk = 0, 1, . . . , N con k nk = N , los cuales
nos dicen cuantas partculas tenemos en cada estado individual para una dada funcion de onda
simetrica. As, resulta
BS2 N !

nk ! = 1

(6.74)

Es posible demostrar (queda como ejercicio para el lector) que las autofunciones
|k1 , . . . , kN iS =
|k1 , . . . , kN iA =

(N !

X
1
P |k1 , . . . , kN i
1/2
k nk !)
P

1 X

(1)P P |k1 , . . . , kN i
N! P

(6.75)
(6.76)

forman un conjunto ortonormal completo en los subespacios de funciones simetricas y antisimetricas


respectivamente. En otras palabras, estas funciones constituyen bases de dichos subespacios y por
lo tanto cualquier funcion de onda arbitraria de N bosones o fermiones (a
un en el caso de partculas
interctuantes) puede ser desarrollada en terminos de las funciones (6.75) o (6.76) respectivamente.
Sin embargo, es importante tener en claro como se indexan los diferentes estados en cada una de

77
eses bases. Cada conjunto de ndices k1 , . . . , kN designa una u
nica funci
on de base, no importando
el orden de los mismos: una permutacion de ndices solo produce un cambio de signo en el caso
antisimetrico y deja totalmente inalterada la funcion en el caso simetrico. En el caso de las funciones
fermionicas, los ndices nunca se repiten. Entonces lo que caracteriza una de estas funciones es
cuantas partculas tenemos en cada estado. Esto puede ser descripto de manera mas clara a traves
de los n
umeros de ocupacion nk . La especficaci
on de los n
umeros de ocupacion para todos los
P
estados posibles k de una partcula, con la restriccion k nk = N determina de manera unvoca
un autoestado simetrizado. En el caso de fermiones, tenemos la restriccion adicional de que los
n
umeros de ocupacion solo pueden adoptar los valores nk = 0, 1.
La (anti)simetrizacion de los estados tiene tambien consecuencias para las posibles cantidades
observables del sistema. Para partculas indistinguibles no tiene sentido calcular valores de expectacion cuanticos de observables que de alguna manera identifiquen individualmente las partculas. Por ejemplo, ya no sera posible calcular la densidad de probabilidad de encontrar la partcula
Nro.2 en la posicion q. Solo podemos calcular la probabilidad de encontrar alguna de las N partcu de un sistema de partculas indistinguibles tienen
las en q. Esto significa que todos los observables O
que ser invariantes ante permutaciones de las partculas:
P ] = 0
[O,
Esto vale en particular para el operador densidad de probabilidad .

6.6.3.

Funci
on partici
on de partculas indistinguibles

para partculas indistinguibles debe


La evaluacion de la funcion particion ZN = Tr exp( H)
entonces realizarse en el subespacio de las funciones simetricas (6.75), en el caso de bosones, o
antisimetricas (6.76) en el caso de fermiones. Para ello podemos usar las bases de autoestados
(6.75) o (6.76).
Para evaluar la traza debemos sumar todos los elementos de matriz diagonales de en dichos
subespacios. Una forma de enumerar todos los posibles estados en un subespacio es sumar sobre
todos los valores posibles de estados de una partcula k1 , . . . , kN . No obstante, dado que es invariante ante el intercambio de partculas, al hacer el calculo de este modo se repetiran terminos que
corresponden a un u
nico estado (anti)simetrizado. Debemos entonces descontar esta degeneracion.
Para el caso de N bosones, para cada conjunto particular de ndices k1 . . . , kN esta repeticion
ocurrira N !/nk1 ! nk2 ! veces. Tenemos entonces:
!

Tr e

1 X X Y
nk 0 !

N! k
0
k
k

=
=

1
N!

2 X

1 X
N!

k1

hk1 , . . . , kN | e H |k1 , . . . , kN iS

k1

(+)

hk1 , . . . , kN | e H |k1 , . . . , kN i(+)

kN

hk1 , . . . , kN | e H |k1 , . . . , kN i(+)

(6.77)

kN

donde el bra en la u
ltima expresion es un estado no simetrizado y
|k1 , . . . , kN i(+)

P |k1 , . . . , kN i

es un estado simetrizado nonormalizado. En forma semejante, para el caso de N fermiones tenemos:

78

Tr e H

1 X XA

hk1 , . . . , kN | e H |k1 , . . . , kN iA
N! k
k

1 X X

hk1 , . . . , kN | e H |k1 , . . . , kN i()


N! k
k

(6.78)

donde
|k1 , . . . , kN i()

(1)P P |k1 , . . . , kN i

Consideremos el ejemplo no realista de la funcion particion Z3 (T ) de tres partculas indistinguibles (bosones o fermiones), para el caso de un gas ideal en una caja de vol
umen V = L3 con
paredes
on 6.2, los autoestados de una partcula
E perfectamente reflectantes. Como vimos en la secci
h~r| ~k vienen dados por la Ec.(6.22) con
~k = nx i + ny j + nz k
L
L
L
3 = p2 /2m +
y con nx , ny , nz enteros positivos. El Hamiltoniano de 3 partculas viene dado por H
1
p22 /2m + p23 /2m y de las Ecs.(6.77)-(6.78) tenemos que

Z3 (T ) = Tr3 e H3 =

1 X X X D~ ~ ~ H 3 ~ ~ ~ E()
k1 , k2 , k3 e
k1 , k2 , k3
3! ~ ~ ~
k1

k2

(6.79)

k3

donde

E
E
E
E
E
E
E
~ ~ ~ ()

= ~k1 , ~k2 , ~k3 ~k1 , ~k3 , ~k2 ~k2 , ~k1 , ~k3 ~k3 , ~k2 , ~k1 + ~k3 , ~k1 , ~k2 + ~k2 , ~k3 , ~k1 (6.80)
k1 , k2 , k3

El primer termino de esta ecuacion contribuye a Z3 (T ) con

E
E
X D
X
2
~

~k1 , ~k2 , ~k3 e H3 ~k1 , ~k2 , ~k3 =


~k e p /2m ~k = eE(k) = [Z1 (T )]3 ,

XXXD
~k1 ~k2 ~k3

~k

~k

el segundo termino con

E
~k1 , ~k2 , ~k3 e H 3 ~k1 , ~k3 , ~k2
=

XXXD
~k1 ~k2 ~k3

X
X
X
~
~
~

eE(k1 )
e(E(k2 )+E(k3 )) ~k2 ,~k3
~k1

~k2 ~k3

X
X
~
~

eE(k1 ) e2E(k)
~k1

= Z1 (T ) Z1

T
2

~k

y as sucesivamente. Tenemos entonces

Z3 (T ) =

1
T
(Z1 (T ))3 3 Z1 (T ) Z1
3!
2

Si recordamos que Z1 (T ) = V /3T con

+ 2 Z1

T
3

(6.81)

79

h
T =
2mkB T
resulta

Z3 (T ) =

1 V
3!
3T
1
3!

V
3T

!3

3
23/2

!3
1

V
3T

3
23/2

!2

3T
V

2
33/2

33/2

V
3T
3T
V

!2

(6.82)

El lmite clasico corresponde a altas temperaturas y/o bajas densidades (V grande) 3T /V 1,


en el cual obtenemos
1
Z3 (T )
3!

V
3T

!3

+O

3 3T
V

Para un gas de N partculas identicas en el lmite clasico tenemos


1
(Z1 (T ))N + O
ZN (T )
N!

N 3T
V

(6.83)

Z1N es la funcion particion para un conjunto de N partculas distinguibles. En el lmite clasico,


los terminos permutados son despreciables y el u
nico remanente de la indistinguibilidad es el factor
1/N !, que es precisamente el contaje correcto de Boltzmann. En este lmite no existe diferencia entre
el comportamiento de bosones y fermiones. A bajas temperaturas y/o altas densidades, los terminos
permutados cobran relevancia y ambos tipos de partculas exhiben comportamientos diferentes.
Desafortunadamente , la evaluacion de ZN por el metodo anterior es sumamente complicada. En el
captulo siguiente vermos que este calculo puede realizarse mas facilmente utilizando otro ensemble
diferente.
Ciertos efectos cuanticos a
un pueden tomarse en cuenta en una descripcion semiclasica de un
gas de partculas con grados internos de libertad. Este sera el caso de un gas de moleculas no
interactuantes que poseen grados internos de libertad que pueden absorver energa, tales como
movimientos rotacionales y vibracionales de la molecula, grados de libertad electronicos, nucleares, etc. Supongamos por simplicidad que tomamos en cuenta solo los movimientos rotacionales
y vibracionales. Para tal sistema el Hamiltoniano de la molecula i-esima puede escribirse como
i = p2 /2m + H
i(rot) + H
i(vib) , donde estamos asumiendo que los diferentes grados de libertad
H
i
estan desacoplados entre s. La funcion particion viene dada por
"

ZN (T ) = TrN exp

N
X
i=1

p2i
i(rot) + H
i(vib)
+H
2m

!#

Si los diferentes operadores que aparecen en este expresion conmutan todos entre s, en el lmite
semiclasico, resulta
ZN (T )

N
1
Z1(tr) Z1(rot) Z1(vib)
N!

donde Z1(tr) = Tr1 e p /2m , Z1(rot) = Tr1 e H(rot) y Z1(vib) = Tr1 e H(vib) . La operacion
Tr1 debe ser llevada a cabo sobre un conjunto completo de estados de una partcula apropiado para
el operador asociado.

80

6.7.

Fluidos cl
asicos no ideales

Fluidos normales son bien descriptos por la estadstica clasica, ya que en general a las temperaturas y densidades a las cuales los efectos cuanticos se vuelven relevantes los mismos solidifican.
El tipo de interaccion mas com
un entre partculas involucra solamente las coordenadas, de
manera que el Hamiltoniano puede expresarse como la suma de un termino de energa cinetica y
un potencial de interaccion Up (q1 , . . . , qN ). La funcion particion, por lo tanto, puede factorizarse
como
ZN (T ) = ZGI Q V N
donde ZGI es la funcion particion del gas ideal (la cual incluye el contaje correcto de Boltzmann) y
Z

dq1 dqN eUp (q1 ,...,qN )

Q=

(6.84)

es llamada a veces funcion particion configuracional, donde las integrales son sobre el vol
umen V .
El valor medio de cualquier funcion que depende solamente de las coordenadas de las partculas
resulta entonces
hf (q1 , . . . , qN )i =

1
Q

dq1 dqN f (q1 , . . . , qN ) eUp (q1 ,...,qN )

(6.85)

Al analizar las propiedades de un fluido debemos tomar en cuenta las simetras del sistema.
En primer lugar, el potencial Up (q1 , . . . , qN ) debe ser simetrico ante permutaciones de partculas,
ya que, aunque distinguibles en la aproximaci
on clasica, son todas identicas. En segundo lugar,
en una fase fluida (gas o liquido) a diferencia de lo que ocurre en un solido, tenemos invariancia
traslacional ya que no existen posiciones privilegiadas. Esto implica que el potencial de interacci
on
debe ser invariante ante un desplazamiento constante de las coordenadas de todas las partculas y
por lo tanto debe depender de las distancias relativas entre las partculas y no de sus posiciones
absolutas2 . Ademas de ser homogeneo (invariancia traslacional) un fluido es isotropico y por lo
tanto el potencial debe ser invariante ante rotaciones del sistema de coordenadas.
Asumiendo las partculas puntuales, la densidad en un vol
umen diferencial centrado en r puede
escribirse como3
p (r) =

N
X

h(r qi )i =

i=1

1
Q

dq1 dqN

N
X

(r qi ) eUp (q1 ,...,qN )

(6.86)

i=1

Debido a la invariancia ante permutaciones de partculas, cada uno de los terminos en la suma
de la ecuacion anterior debe ser igual a los demas. Por lo tanto, podemos escribir
N
p (r) =
Q

dq2 dqN

dq1 (r q1 ) eUp (q1 ,...,qN )

Ademas, dado que Up depende de las distancias relativas |qi qj |, podemos hacer un cambio de
variables qi0 = qi q1 para i = 2, . . . , N , con lo cual
p (r) =

N
Q

0 U (q2 ,...,qN )
dq20 dqN
e

dq1 (r q1 ) =

N
Q

0 Up (q2 ,...,qN )
dq20 dqN
e

(6.87)

En forma semejante
2

Estamos considerando un vol


umen macrosc
opico y por lo tanto despreciamos los efectos de borde en el lmite
termodin
amico.
3
La coordenada r aqui representa una variable macrosc
opica, es decir, que vara en cantidades mucho mayores que
las longitudes microsc
opicas caractersticas.

81
Z

Q=

0 )
0 Up (q20 ,...,qN
dq20 dqN
e

0 Up (q2 ,...,qN )
dq20 dqN
e

dq1 = V

(6.88)

de donde p (r) = N/V para todo r dentro del vol


umen V . La densidad de partculas en un fluido
es siempre constante en cualquier punto, independientemente de que las partculas interact
uen (en
una fase solida cristalina esta invariancia se rompe, ya que las partculas se localizan en posiciones
fijas en el espacio).
Para un gas ideal las posiciones de todas las partculas son totalmente independientes entre
s. En un fluido real las interacciones inducen correlaciones entre las posiciones de las diferentes
partculas. Una manera de describir estas correlaciones es a traves de la funci
on de distribuci
on
de pares g(r), que se define como sigue. Sea rij qi qj el vector distancia relativa entre las
partculas i y j. Entonces:
g(r)

X
2V
h(r rij )i
N (N 1) (i,j)

(6.89)

donde la notacion (i, j) indica que cada par se cuenta una sola vez. La funcion g(r) nos da el
n
umero medio de pares de partculas ubicadas a una distancia r. En primer lugar notemos que, por
la simetra ante permutaciones de partculas del potencial, los promedios en la Ec.(6.89) son todos
iguales. Ademas, por la isotropa del potencial, g no puede depender de la orientaci
on del vector r
y solo puede depender de su modulo r = |r|. As
g(r) = V h(r r12 )i

(6.90)

donde la eleccion del par 1-2 es arbitraria. En el caso de un gas ideal el potencial U = 0. Un calculo
directo da que h(r r12 )i = 1/V y g(r) = 1. Esto significa que todas las distancias entre partculas
son equiprobables. Para el caso interactuante tenemos
Z

g(r) =
=

V
0
0
0
dq20 (r q20 ) dq30 dqN
eUp (q2 ,...,qN )
Q
Z
V2
0
0
0
dq30 dqN
eUp (r,q3 ...,qN )
Q

dq1
(6.91)

El caso mas frecuente es aquel en el cual la energa potencial es una suma de potenciales de
pares, los cuales dependen solamente de la distancia entre partculas, esto es
Up =

u(rij )

(6.92)

(i,j)

Tomando en cuenta la simetra ante permutaciones de partculas del potencial, tenemos entonces

hUp i =
=
=

N (N 1)
hu(r12 )i
2
Z
Z
Z
N (N 1)
0 )
0
0
0
0
Up (q20 ,...,qN
dq2 u(q2 ) dq3 dqN e
dq1
2Q
Z
Z
V N (N 1)
0
0
d3 r u(r) dq30 dqN
eUp (r,...,qN )
2Q

(6.93)

Usando la Ec.(6.91) y tomando en cuenta la energa cinetica obtenemos finalmente la ecuacion


de estado
3
N (N 1)
U = hHi = N kB T +
2
2V

d3 r u(r) g(r)

(6.94)

82
donde la integral es sobre todo el vol
umen V (no debemos olvidar que g(r) depende tambien de
T ). La ecuacion de estado para la presion tambien puede expresarse en funcion de g(r):
F
ln ZN
= kB T
V
V

ZGI Q
VN
Q
= kB T
ln
=
k
T

+
k
T
p
B
B
V
VN
Q V V N

(6.95)
(6.96)

Para evaluar la u
ltima derivada consideremos que el sistema se encuentra en una caja c
ubica de
3
vol
umen V = L . Podemos entonces calcular Q integrando en coordenadas cartesianas, donde cada
una de las 3N coordenadas se integra entre 0 y L. Llamemos entonces ~q al vector que contiene las
3N coordenadas. Si hacemos el cambio de variable ~x = ~q/L obtenemos
Q=V

Z 1
0

dx1

Z 1
0

dx3N eUp (L~x)

y as

Q
VN

=
2/3
L
3V

Q
VN

= 2/3
3V

Z 1
0

dx1

Z 1
0

dx3N

Up (L~x) Up (L~x)
e
L

X du(rij )
Up (L~x)
=
(rij /L)
L
dr
(i,j)

Transformando nuevamente a las variables q y usando la simetra ante permutaciones de Up obtenemos

Q
VN

N (N 1)
du(r12 ) Up (q1 ,...,qN )
=
e
dq1 dqN r12
N
+1
6V
dr
Z
Z
Z
N (N 1)
du(r)
0
0
3
0
=
d
r
r
dq

dqN eUp (r,q3 ,...,qN )


3
N
6V
dr
Z
N (N 1)Q
du(r)
g(r)
=
d3 r r
N
+2
6V
dr

(6.97)

Reemplazando en la Ec.(6.96), en el lmite termodinamico obtenemos finalmente la ecuacion de


estado para un fluido normal (con interacciones de pares)

2p 3 du(r)
P = kB T p 1
g(r) dr
(6.98)
r
3kB T 0
dr
la cual se conoce como ecuacion de estado del virial. Vemos que las ecuaciones de estado quedan
completamente determinadas si conocemos el potencial de interacci
on y la funcion g(r).
La funcion g(r) puede obtenerse mediante experimentos de scattering. En los mismos un haz
de partculas de prueba (rayos X, neutrones o electrones) con momento h
~k 0 se hace incidir sobre
el material (podemos representarlas por ondas planas). Las partculas incidentes interact
uan con
las moleculas del material, las cuales act
uan como centros dispersores. As, el n
umero de partculas
dispersadas con momento h
~k 00 depende de la distribucion de las moleculas en el material y es
descripta por la seccion diferencial de scattering, la cual en una primera aproximaci
on resulta
proporcional a
2 +
* N

X i~k.~q
j
~

I(k) =
e

j=1

(6.99)

83

Figura 6.1: Potencial de Lennard-Jones.

donde ~k = ~k 00 ~k 0 y el promedio se toma en ensemble. I(~k) se conoce como la funcion de estructura.


Tenemos
I(~k) =

*N N
+
XX ~
ik.(~
qj ~
ql )

=N+

j=1 l=1

X ~
ik.(~
qj ~
ql )

(6.100)

j6=l

Dado que la cantidad a promediar solo depende de las coordenadas, tenemos


1 X
I(~k) = N +
Q j6=l

dq1 dqN eik.(~qj ~ql ) eU (q1 ,...,qN )


Z

N (N 1)
~
dq1 dqN eik.(~q2 ~q1 ) eU (q1 ,...,qN )
Q
Z
V N (N 1)
0
0
~ 0
0
= N+
dq20 dqN
eik.~q2 eU (q2 ,...,qN )
Q
= N+

(6.101)

Comparando con la Ec.(6.91) obtenemos


Z

N (N 1)
~
I(~k) = N +
d3 r eik.~r g(r)
(6.102)
V
esto es, la funcion de estructura esta directamente relacionada a la transformada de Fourier de la
funcion de distribucion de pares. Esto permite tanto obtener ecuaciones de estado de fluidos de
manera emprica, como contrastar predicciones teoricas con resultados experimentales.
Para la mayora de los fluidos normales el potencial de interacci
on de pares es repulsivo a muy
cortas distancias (interaccion de carozo duro) y atractivo a distancias cortas. Un ejemplo tpico es
el potencial semi-emprico de Lennard-Jones
"
12

u(r) = 4

6 #

(6.103)

el cual se muestra en la Fig.6.1. tiene unidades de longitud y representa el diametro de carozo duro
(distancia mnima a la cual pueden aproximarse dos partculas), ya que u(r) se anula en r = y u(r)
crece rapidamente para r < . Para distancias r > la interacci
on es atractiva con un mnimo en

84

Figura 6.2: Funcion distribucion de pares para el potencial de Lennard-Jones, calculada mediante
simulaciones numericas para kB T / = 0,71 y p = 0,844.

r = 21/6 y tiende rapidamente a cero como 1/r6 para r , al igual que una interacci
on de Van
der Waals. La intensidad de la interaccion a una distancia r = 2,5 es inferior al 1 % del valor en el
mnimo. La funcion g(r) para potenciales de este tipo tiene la forma caracterstica que se muestra
esquematicamente en la Fig.6.2, la cual puede interpretarse como sigue. Si nos paramos en una
molecula dada, p g(r) nos da la densidad promedio de partculas que observariamos a una distancia
r. As, g(r) = 0 para r , ya que la probabilidad de encontrar dos partculas a una distancia menor
que esta es cero. g(r) muestra tpicamente picos espaciados a una distancia levemente mayor que .
El primer pico en general es el dominante, debido a la interacci
on atractiva a cortas distancias. Los
demas picos reflejan la competencia entre interacciones atractivas y repulsiva entre las diferentes
partculas. A distancias grandes, esta correlacion se pierde y g(r) converge asint
oticamente a g = 1,
aproximando el comportamiento de un gas ideal. La distancia y distribucion de los picos brinda
informacion acerca de las correlaciones espaciales entre partculas. Cuanto mas diluido el gas, menos
picos se observan en g(r). Estos comportamientos son radicalmente diferentes al que se observa en
el caso de un solido cristalino. En primer lugar, en un solido g(~r) no es isotropica. Pero ademas, la
misma exhibe picos espaciados regularmente correspondientes a los sitios del cristal, no importando
la distancia.
En el caso de fluidos debilmente interactuantes a bajas densidades es posible obtener una aproximacion para la ecuacion de estado como sigue. Sea la funcion
f (r) = eu(r) 1

(6.104)

Denominando fij f (rij ) podemos escribir la funcion particion configuracional como


Z

Q=

dq1 dqN

eu(rij ) =

dq1 dqN

(i,j)

[1 + fij ]

(6.105)

(i,j)

Desarrollando los productos tenemos

Q= =

dq1 dqN 1 +

= V N + V N 2

XZ
(i,j)

X
(i,j)

fij +

1X

2 (i,j) (k,l)6=(i,j)

dqi dqj fij +

fij fkl +

85
Z

N (N 1)
d3 rf (r) +
2

N (N 1)
= VN 1
B(T ) +
V

= V N + V N 1

(6.106)

donde
Z

h
i
1
d3 r eu(r) 1
(6.107)
B(T ) =
2
se conoce como segundo coeficiente del virial. Si despreciamos los terminos superiores en el
desarrollo anterior tenemos la aproximaci
on

Q
N2

B(T )
VN
V
y de la Ec.(6.96)
P = kB T p + kB T

N2
B(T )
V2
N2
V B(T )

y para N 2 B(T )/V 1 obtenemos finalmente


P kB T p [1 + p B(T )]

(6.108)

De hecho, puede demostrarse que, para potenciales de muy corto alcance, la ecuacion de estado
admite un desarrollo en potencias de la densidad de partculas
P = kB T [p + 2p B(T ) + 3p C(T ) + ]

(6.109)

el cual se conoce como desarrollo del virial. Vemos entonces que la aproximaci
on (6.108) resulta
valida a muy bajas densidades. Si integramos la Ec.(6.107) por partes, para un potencial tipo
Lennard-Jones obtenemos
B(T ) =

2
3

Z
0

r3

du(r) u(r)
e
dr
dr

(6.110)

Reemplazando en la Ec.(6.108) y comparando con la Ec.(6.98) vemos que truncar el desarrollo del
virial al segundo orden equivale a aproximar g(r) por
g(r) = eu(r)

(6.111)

En la Fig.6.3 vemos la aproximacion a segundo orden del virial para el potencial de Lennard-Jones.
La misma da cuenta solamente del primer pico. Para describir los demas picos resulta necesario
tomar en cuenta ordenes superiores, a menos que el gas sea muy diluido.

6.8.

Calor especfico de los s


olidos.

Vamos a revisar el problema de las vibraciones en un solido cristalino en mas detalle, ahora
utilizando el ensemble canonico. Consideremos un sistema de partculas que interact
uan a traves
un potencial de pares, como el que vimos en la seccion anterior Ec.(6.92). A temperaturas suficientemente bajas el sistema solidifica, porque existe una configuracion ordenada de partculas
que mnimiza la energa (6.92). Esto no significa que las partculas queden fijas en los sitios del
cristal, ya que por efecto termico, las mismas presentar
an peque
nas oscilaciones en torno de dichos
stios (oscilaciones de gran amplitud fundiran el cristal y ocurren a temperaturas mayores). En

86

Figura 6.3: Aproximacion a segundo orden del virial de la funcion distribucion de pares para el
potencial de Lennard-Jones a kB T / = 1.

esas condiciones, el potencial (6.92) puede ser aproximado por un potencial armonico (podemos
desarrollar el mismo en Taylor hasta el segundo orden), de donde los movimientos colectivos de las
partculas pueden ser descompuestos en modos normales. Dichos modos corresponden a ondas de
sonido en el cristal (transversales y longitudinales) con una distribucion de frecuencias que depende
de la estructura cristalina particular.
Tomemos, por ejemplo el caso de un conjunto de N partculas restringidas a moverse en una
dimension, las cuales interact
uan a traves de un potencial de Lennard-Jones (6.103). Debido al
caracter de corto alcance de las interacciones, resulta evidente que el mnimo de energa potencial
ocurre si las partculas se encuentran equiespaciadas una a distancia a 21/6 (la distancia del
mnimo de u(r)). A temperatura cero (esto es, en ausencia de energa cinetica) este sera el estado de
equilibrio. El mismo corresponde a partculas localizadas a lo largo de una cadena, en las posiciones
xn = na con n = 1, 2, . . . , N . a se conoce como parametro de red. Por simplicidad vamos a asumir
condiciones de contorno periodicas xN +1 = x1 , con lo cual la cadena se transforma en un anillo.
Esto no es para nada restrictivo, ya que en el lmite termodinamico las propiedades deberan ser
independientes de las condiciones de contorno. A bajas temperaturas las partculas tendran cierta
energa cinetica y por lo tanto podran efectuar peque
nos desplazamientos en torno de las posiciones
de equilibrio. En estas circunstancias, cada partcula esta basicamente ligada a un sitio del anillo y
por lo tanto se vuelven distinguibles.
Definamos el desplazamiento de la partcula n-esima respecto de la posicion de equilibrio xn
como yn qn xn . Para bajas temperaturas los desplazamientos seran peque
nos y por lo tanto
podemos aproximar el potencial de interacci
on entre cada par de partculas mediante un potencial
cuadratico (desarrrollo en Taylor hasta segundo orden en torno de r = a). As, a menos de una
constante el Hamiltoniano clasico puede ser escrito como
H=

N
N
X
X
p2n
1
+ K
(yn+1 yn )2
n=1

2m

(6.112)

n=1

donde yN +1 = y1 y K = d2 u(r)/dr2 |r=a > 0. De la mecanica clasica, sabemos que para un


Hamiltoniano cuadratico como el anterior existe una transformacion canonica a un conjunto de
variables (modos normales) (Pk , Qk ), tal que en terminos de dichas variables el mismo resulta

87

H=

N
X
1
k=1

2m

Pk2 +

1
m k2 Q2k
2

(6.113)

Estas nuevas coordenadas describen movimientos oscilatorios colectivos (modos normales) que corresponden a ondas longitudinales en la cadena. Las frecuencias de oscilacion pueden obtenerse
notando que los modos normales corresponden a combinaciones lineales de soluciones de la forma
yn ei(knak t)

(6.114)

Las condiciones de contorno periodicas implican que yn+N = yn y por lo tanto


eikN a = 1
de donde los vectores de onda permitidos son
k=

2m
aN

con m = 0, 1 2, . . . , (N 1)/2, N/2; otros valores de m repiten alguna de las soluciones anteriores, ya que si cambiamos k en 2/a la solucion permanece invariante. As, tenemos exactamente N
soluciones independientes, cuyos valores de k se encuentran en el intervalo /a, el cual se conoce
como 1ra Zona de Brillouin.
Las ecuaciones de movimiento tienen la forma
d2 yn
= K(2yn yn+1 yn1 ) n = 1, , N
dt2
Si reemplazamos la solucion (6.114) en las ecuaciones de movimiento obtenemos
m

(6.115)

mk2 ei(knak t) = K[2 eika eika ] ei(knak t)


= 2K(1 cos ka) ei(knak t)
de donde obtenemos la relacion de dispersion
s

k =

2K(1 cos ka)


=2
m

K
|sin(ka/2)|
m

(6.116)

la cual se muestra en la Fig.6.4. Las soluciones (6.114) describen ondas longitudinales que se propagan a lo largo de la cadena con velocidad de fase cs = k /k y velocidad de grupo v = /k. Para
valores peque
nos de k (longitudes de onda grandes) la relacion de dispersion es aproximadamente
lineal ypla velocidad de grupo es aproximadamente independiente de k e igual a la velocidad de fase
cs a K/m. Esta es la velocidad del sonido en el solido.
El desarrollo anterior puede extenderse facilmente al caso tridimensional4 . En este caso los
atomos pueden ordenarse en diferentes estructuras cristalinas. El caso mas simple corresponde a una
estructura c
ubica simple, en la cual las tres coordenadas atomicas de los sitios de mnima energa se
encuentran equiespaciadas una distancia a: xn = nx a, yn = ny a, zn = nz a, con nx , ny , nz = 1, , L.
El n
umero total de atomos es N = L3 . Imponiendo condiciones de contorno periodicas en las tres
direcciones, los vectores de onda permitidos para los modos normales tienen componentes
4

Es importante recalcar que el desarrollo anterior no intenta formular un modelo de solidificaci


on en una dimensi
on,
sino simplemente resolver el problema te
orico de las oscilaciones en una dimensi
on para luego extenderlo al caso
tridimensional. Por motivos que exceden el presente curso, puede verse que no es posible estabilizar un cristal a
cualquier temperatura finita en dimensiones menores que 3.

88

Figura 6.4: Relacion de dispersion para una cadena lineal armonica.

2mi
con i = x, y, z y mi = 0, 1, 2, (L 1)/2, L/2
(6.117)
aL
totalizando N vectores de onda. Cada componente toma valores en el intervalo /aL. Esto define
un cubo de lado 2/aL en el espacio recproco (el espacio de los vectores de onda), es cual constituye
la 1ra zona de Brillouin en el caso 3D. En tres dimensiones es posible tener ondas longitudinales
y transversales. Esto da lugar, por cada vector de onda, a tres soluciones diferentes, cada una con
una relacion de dispersion s (~k) con s = 1, 2, 3. Para valores peque
nos de k estas relaciones de
dispersion son aproximadamente lineales en k en forma semejante al caso unidimensional, dando
lugar a dos velocidades del sonido diferentes, una para ondas longitudinales cl y otra para ondas
transversales ct (los dos modos transversales corresponden a dos polarizaciones diferentes y por lo
tanto tienen la misma velocidad del sonido). El Hamiltoniano puede escribirse entonces como una
superposicion de 3N osciladores armonicos independientes, que difieren en sus frecuencias:
ki =

H=

N X
X
1

1
+ m s (~k)2 Q~2k,s
2

P2
2m ~k,s

k=1 s

(6.118)

Podemos ahora volver al problema del calor especfico de este sistema. Como vimos en la seccion
5.2.3, el calor especfico clasico de un sistema de osciladores armonicos independientes es totalmente
independiente de las frecuencias de los osciladores (este resultado puede reobtenerse facilmente en
el ensamble canonico). Por lo tanto, el desarrollo anterior en modos normales no nos aporta nada
nuevo. Debemos entonces considerar la versi
on cuantificada del Hamiltoniano (6.118), esto es
H=

XX
~k

(n~k,s + 1/2) hs (~k)

(6.119)

donde n~k,s = 0, 1, . Los autoestados de este Hamiltoniano son el producto directo de los 3N
autoestados de cada oscilador armonico. En esta base el operador densidad es diagonal y podemos
escribir

ZN (T ) = TrN exp

XX

X
{n~k,s }

exp

~k

(n~k,s + 1/2) hs (~k)

XX
~k

(n~k,s + 1/2) hs (~k)

(6.120)

89
donde {n~k,s } denota todos las posibles combinaciones de valores enteros para los n
umeros cuanticos
n~k,s ; en otras palabras, tenemos 3N sumas que van de cero a infinito. As

ZN (T ) =

X
Y
~k,s

n~ =0
k,s

exp (n~k,s + 1/2) hs (~k)

Y ehs (~k)/2
~k,s

(6.121)

1 ehs (~k)

y
ln ZN (T ) =

X
hs (~k)
~k,s

U =

ln 1 ehs (k)

(6.122)

~k,s

ln ZN (T ) X
hs (~k) X
hs (~k)
=
+

hs (~k) 1

2
~
~ e
k,s

(6.123)

k,s

Los vectores de onda en las sumas anteriores estan espaciados a una distancia ki = 2/aL. As,
en el lmite termodinamico L podemos aproximar la sumas por integrales. La energa por
partcula u = U/N resulta
"

Z
Z /a
Z /a
a3 X /a
hs (~k)

s (~k)
h
u=
+
dk
dk
dkz
x
y
3
(2) s /a
2
/a
/a
ehs (~k) 1

(6.124)

y el calor especfico

c=

Z /a
Z /a
~
X Z /a
1 u
a3 h2
u
s2 (~k) ehs (k)
=
=
dk
dk
dk
x
y
z
T
kB T 2
kB T 2 (2)3 s /a
/a
/a
(ehs (~k) 1)2

(6.125)

En general no es facil resolver la integral anterior y se hace necesario introducir alguna aproximacion. El modelo de Einstein consiste en asumir que todas las frecuencias son iguales. No obstante,
vimos que esta aproximacion tan drastica no describe correctamente el comportamiento a muy bajas
temperaturas. A continuacion veremos un modelo mas refinado introducido por Debye.

6.8.1.

El modelo de Debye.

El error principal introducido en el modelo de Einstein consiste en no considerar los modos de


bajas frecuencias (ondas de sonido), los cuales son particularmente relevantes a bajas temperaturas.
La aproximacion de Debye consiste en reemplazar las tres relaciones de dispersion por tres relaciones
ac
usticas identicas (~k) = cs |~k|, donde cs es una velocidad del sonido promedio. Ademas, para
simplificar los calculos se reemplaza la integral en la primera zona de Brillouin (un cubo) por una
integral en una esfera de radio kD . El radio kD se elige de manera tal que el n
umero de estados en
la esfera sea igual a N . Si consideramos que cada estado ocupa en el espacio recproco un vol
umen
(2/aL)3 tenemos que
4 3
6 2
3
N = kD
/(8 3 /a3 N ) kD
= 3
3
a
En la aproximacion de Debye, el calor especfico resulta

90

3 a3 h2 c2s
c=
2kB T 2 2

Z kD
0

k 4 ehcs k
9 kB
dk =

h
c
k
2
s
(e
1)
(
hD )3

Z D /T
0

x 4 ex
dx
(ex 1)2

(6.126)

donde D = cs kD es la frecuencia de Debye y D = hD /kB es la temperatura de Debye. Para


altas temperaturas D /T 1 podemos expandir en potencias de x el integrando en la Ec.(6.126),
con lo cual nos queda x2 . As, un calculo directo muestra que c 3kB , con lo cual recuperamos la
ley de Dulong y Petit. Para bajas temperaturas D /T 1 podemos reemplazar el lmite superior
de integracion por +, ya que el integrando decae exponencialmente para x 1. De Tablas
Z
0

4 4
x4 ex
dx =
2
1)
15

(ex

y as
12kB 4
c
5

T
D

que reproduce el comportamiento observado experimentalmente.

(6.127)

Captulo 7

El Ensamble Gran Can


onico
A pesar de que los ensembles microcanonico y canonico dan resultados equivalentes (en el
lmite termodinamico), puede argumentarse que conceptualmente el ensemble canonico brinda una
representacion mas cercana a las situaciones fsicas reales. En los experimentos resulta imposible
aislar completamente un sistema. Mas a
un, uno nunca mide directamente la energa total de un
sistema macroscopico: solo accedemos a ella a traves de mediciones indirectas. Por el contrario, la
temperatura es un parametro facilmente medible y controlable. La equivalencia entre ensambles
nos permite entonces desarrollar una intuici
on fsica, en relacion mas directa con la situacion fsica
real, sin tener que pasar por una construccion teorica relativamente artificial.
En la misma lnea argumental, podemos considerar poco fsico especificar el n
umero de partculas
de un sistema macroscopico, ya que resulta imposible en la practica conocer esta cantidad con
precision. Lo u
nico que podemos determinar en un experimento es el n
umero promedio de partculas,
cantidad a la cual accedemos tamben de manera indirecta. Esta es una de las motivaciones para
introducir un nuevo ensemble, el ensamble gran can
onico, en el cual el sistema puede tener un
n
umero arbitrario de partculas, siendo u
nicamente su promedio especificado por las condiciones
externas. La situacion es enteramente analoga a la del ensamble canonico, en el cual la energa
media del sistema esta determinada por la temperatura del reservorio con el cual se encuentra en
contacto.
Como veremos, los resultados obtenidos en este nuevo ensemble resultan equivalentes a los
obtenidos en el ensamble canonico y microcanonico en el lmite termodinamico. As, mas alla de
cualquier interpretacion fsica, cabe resaltar que el uso de uno u otro ensamble en aplicaciones
concretas de la teora depende mas de conveniencias de calculo que de consideraciones fsicas.
Como veremos, ciertos calculos muy complicados en un ensemble pueden resultar casi triviales en
otro. As, la eleccion del ensamble apropiado puede resultar crucial a la hora de aplicar la teora a
problemas particulares.

7.1.

Formulaci
on general: relaci
on con la termodin
amica

Supongamos entonces un sistema que puede intercambiar tanto partculas como energa con el
medio ambiente en el cual se encuentra inserto. El medio ambiente act
ua entonces a la vez como
reservorio de temperatura y de partculas. Vamos a suponer que el vol
umen del sistema se mantiene
constante, de manera que pensamos que el sistema se encuentra separado del reservorio por paredes
rgidas pero permeables1 .
Si el sistema se encuentra en equilibrio con el reservorio, el n
umero de partculas no sera mas
constante, pero podemos asumir que tanto su energa media como su densidad media, esto es, el
n
umero medio de partculas, permanecen constantes. Los estados accesibles del sistema son en este
1

Que existan o n
o realmente este tipo de paredes no afecta los resultados de la teora. En ultima instancia, podemos
considerarlas como una idealizaci
on conveniente.

91

92
caso los autoestados de la energa para una particula, para dos partculas, etc.. De esta manera, el
espacio de Hilbert estara contituido por la suma directa de los espacios de Hilbert de una, dos, tres,
etc. partculas. Dichos subespacios pueden ser caracterizados definiendo un operador n
umero de
, tal que cualquier estado con un n
partculas N
umero bien definido de partculas N es autoestado
con autovalor N .
de N
no mezcla estados de subespacios con diferVamos a asumir que el operador Hamiltoniano H
. Esto significa la matriz que lo representa
entes n
umeros de partculas, es decir, que conmuta con N

0, H
1 , etc., donde
en una base de autoestados de N tendra una estructura diagonal en bloques H
N es el hamiltoniano de N partculas.
H

N con autovalor E N entonces


Sea ElN , N es autoestado de H
l

ElN , N = ElN ElN , N


H

ElN , N = N ElN , N
N

N . Si H
conmuta con N
,
donde el ndice l corre sobre todos los autoestados del Hamiltoniano H
entonces tambien lo hace y por lo tanto tambien tiene una estructura diagonal en bloques.
El n
umero maximo de partculas puede estar acotado o no, dependiendo del problema. En el caso
de partculas con un vol
umen atomico finito, existira un n
umero maximo Nmax que podremos alojar
en un vol
umen V . En ese caso, los elementos de matriz de deberan ser cero en cualquier subespacio
con N > Nmax . En el caso de partculas puntuales Nmax = . Asumamos

E por simplicidad este


N
u
ltimo caso. Si trabajamos en la base de autoestados de la energa El , N , el operador densidad
sera diagonal y sus autovalores seran
D

N
N
| ElN
l = El |

.
(de aqu en mas omitiremos el doble subndice para simplificar la notacion). Tenemos entonces que
P N
culas.
l l nos da la probabilidad de que el sistema contenga N part
Para encontrar aplicamos el principio variacional de Gibbs, esto es, vamos a maximizar la
entropa
S = kB Tr (
ln ) = kB

X
X

N
N
l ln l

(7.1)

N =0 l

sujeta a los vnculos de normalizacion


X
X

Tr (
) =

N
l = 1,

(7.2)

N =0 l

energa media
D E

= Tr H
=
U H

X
X

ElN N
l = cte

(7.3)

N
l = cte

(7.4)

N =0 l

y n
umero medio de partculas

=
hN i = Tr N

X
N =0

X
l

93
Introduciendo multiplicadores de Lagrange para cada uno de los vnculos anteriores, la variaci
on
N
de la entropa (7.1) al producir variaciones independientes l en los autovalores de viene dada
por

"
X Xn

0 N
l

1 ElN N
l

2 N N
l

kB N
l

ln N
l

#
o

=0

(7.5)

N =0 l
X
X

N
(0 kB ) + 1 ElN + 2 N kB ln N
l
l

=0

(7.6)

N =0 l

de donde
N
kB ln N
l + (0 kB ) + 1 El + 2 N = 0

(7.7)

y N
tenemos la igualdad entre
Dado que esto vale para cada uno de los autovalores de ,
H
operadores
+ 2 N
=0
kB ln (
) + (0 kB )I + 1 H

(7.8)

de donde

= e(0 /kB 1) exp

1
2
H+
N
kB
kB

(7.9)

A fin de identificar los multiplicadores de Lagrange multiplicamos primero la ecuacion anterior


por y tomamos traza, con lo cual la condicion de normalizacion nos da que

Z e(10 /kB ) = Tr exp

2
1
H+
N
kB
kB

(7.10)

donde la ecuacion anterior define la funci


on gran partici
on Z. Para determinar los multiplicadores
1 y 2 multiplicamos la Ec.(7.8) por y tomamos traza, de donde
S + 1 U + 2 hN i kB ln Z = 0

(7.11)

Si multiplicamos la Ec. anterior por T y comparamos con la transformada de Legendre de la energa


con respecto a S y a hN i:
T S + 1 T U + 2 T hN i kB T ln Z = 0

(7.12)

= U T S hN i

(7.13)

donde es el potencial qumico, vemos que podemos identificar 1 = 1/T , 2 = /T y


(, T ) = kB T ln Z(, T )

(7.14)

se conoce como el potencial gran can


onico y la relacion anterior nos da la ecuacion fundamental
para el ensemble gran canonico. Con estas identificaciones tenemos finalmente las expresiones:

Z(T, V, ) = e(T,V,) = Tr e(HN )

(7.15)

y
1 (H

)
N
e
Z
donde hemos incluido ahora explcitamente el vol
umen del sistema.
=

(7.16)

94
En el caso clasico, la derivacion es enteramente analoga. En este caso definimos una densidad de
probabilidad (p, q, N ), la cual nos da la probabilidad de que el sistema contenga N partculas con
momentos y coordenadas (p, q). Podemos pensarla como una familia discreta de funciones densidad
indexadas por N , tal que densidad N -esima es funcion de 6N variables reales, sujetas a la condicion
de normalizacion
Z
X

(p, q, N ) dp dq = 1

N =0

donde cada integral se extiende sobre todo el espacio de las fases de N partculas.
La densidad que maximiza la entropa de Gibbs toma la forma
(p, q, N ) =

1 (H N (p,q)N )
e
Z

donde
Z=

1
B h3N
N =0 N

e(H

N (p,q)N )

dp dq

con BN = 1 para partculas distinguibles y BN = N ! para partculas indistinguibles. Vemos que, al


igual que en el ensemble canonico, todas las expresiones formales tienen la misma forma en el caso
cuantico que en el clasico si adoptamos en este u
ltimo la notacion
Tr

1
B h3N
N =0 N

dp dq

Salvo indicacion contraria, todo lo que sigue es valido tanto para el caso cuantico como para el
clasico.
Para completar la identificacion de la expresion (7.14) con la transformada de Legendre de la
energa debemos verificar que la misma sea consistente con las relaciones termodinamicas derivadas.
Para ello calculemos a partir de la Ec.(7.14) la derivada

1 Z
1 Z

= kB ln (Z) + kB T
= kB ln (Z)
T
Z T
T Z

(7.17)

donde hemos usado que

1
=
T
kB T 2
De la definicion de Z tenemos que
h
i
Z
= Tr e(HN ) (H N )

(7.18)

de donde
1

= kB ln (Z) + U hN i
T
T
T
Pero tenamos de la expresion variacional que

kB ln (Z) = U + hN i + S
T
T
de donde verificamos la relacion

(7.19)

95

S=

(7.20)
V,

Con un calculo semejante podemos verificar tambien que

hN i =

(7.21)
T,V

Notemos que V para V 1, es decir, es una funcion extensiva del vol


umen. As, hN i V .
Por otra parte tenemos las siguientes relaciones para la energa interna a partir de la Ec.(7.18):
U (T, V, ) =

ln Z
()
+ hN i =
+ hN i

(7.22)

Ademas, usando la ecuacion de Euler U = T S P V + N tenemos que

(7.23)
V
Finalmente, si calculamos la funcion particion en la base de autoestados de la energa obtenemos
la expresion general
= P V

Z = Tr e(HN ) =

P =

X
X

N N )

e(El

N =0 l

N =0

eN

eEl

z N ZN (T )

(7.24)

N =0

donde ZN (T ) es la funcion particion canonica de N partculas y


z e

(7.25)

se conoce como la fugacidad.

7.2.

Fluctuaciones en el n
umero de partculas: equivalencia de ensembles

En el ensamble gran canonico la energa media y el n


umero medio de partculas son constantes
para T y fijos. No obstante, dado que el sistema puede intercambiar energa y partculas con el
medio externo, existiran fluctuaciones con respecto a estos valores medios. Es importante entonces
conocer la magnitud de estas fluctuaciones. A fin de calcular las fluctuaciones en el n
umero medio
de partculas podemos escribir la condicion de normalizacion de la siguiente manera
Tr = Tr e((T,)H+N ) = 1

(7.26)

Derivando respecto de tenemos

Tr

+ N e((T,)H+N ) = 0

h
i

+ Tr N e((T,)H+N ) = 0

(7.27)
(7.28)

96
Derivando nuevamente respecto de tenemos

2
+ Tr N
2

+ N e((T,)H+N ) = 0

h
i
2
2
2
2
N

=0
+

Tr
[N
]
+

Tr
2

(7.29)

(7.30)

Usando la Ec.(7.21) tenemos


D

N 2 hN i2 = kB T

2
hN i
= kB T
2

(7.31)

de donde la desviacion fraccional en el n


umero de partculas se comporta como
q

hN 2 i hN i2
hN i

V 1/2

A medida que el vol


umen (y por lo tanto el n
umero de partculas) se incrementa el tama
no de las
fluctuaciones se vuelve cada vez mas peque
no comparado con la magnitud del n
umero medio de
partculas. Con un calculo semejante al utilizado en el ensamble canonico puede mostrarse tambien
que
q

hE 2 i hEi2
hEi

V 1/2

Vemos que en el lmite termodinamico la mayora de los microestados probables tienen el mismo
n
umero de partculas y la misma energa, con lo cual los tres ensembles resultan equivalentes.
Finalmente, notemos la similitud en la estructura del operador densidad en los ensembles
canonico y gran canonico, en relacion al principio variacional de Gibbs. El operador resulta siempre porporcional a la exponencial de una combinaci
on lineal de observables, uno por cada vnculo
macroscopico que imponemos al sistema. Los valores medios de dichos observables corresponden a
variables termodinamicas extensivas. Los coeficientes de dicha combinaci
on lineal estan asociados a
los multiplicadores de Lagrange respectivos y resultan iguales al parametro termodinamico intensivo asociado al observable en la representaci
on entropa: 1/T en el caso de la energa y /T en el
caso del n
umero de partculas. La generalizacion de este procedimiento permite derivar diferentes
tipos de ensembles, apropiados para cada problema particular, los cuales resultan todos equivalentes en el lmite termodinamico. Un ejemplo es el llamado ensemble de las presiones, que
corresponde a la situacion fsica de una sistema en contacto con un reservorio de temperatura y
presion. En este caso, el n
umero de partculas es constante, pero la energa y el vol
umen pueden
fluctuar. Los vnculos externos son entonces la energa media y el vol
umen medio. Mediante una
derivacion semejante a la utilizada para el ensemble gran canonico, se encuentra que la funcion
gran particion en el caso del ensemble de las presiones viene dada por
(P, T, N ) =

Z
0

Tr e(H+P V ) dV =

Z
0

eP V ZN (T, V ) dV

donde ZN (T, V ) es la funcion particion canonica para N partculas en un vol


umen V y
G(T, P, N ) = kB T ln (P, T, N )
es la energa libre de Gibbs. La derivaci
on se deja como ejercicio para el lector.

97

7.3.

Gases Ideales Cu
anticos

El tratamiento cuantico correcto de un gas ideal requiere tomar en consideracion la indistinguibilidad de las partculas. Esto significa que los microestados accesibles del sistema deben corresponder exclusivamente a funciones de onda simetricas, en el caso de bosones o antisimetricas, en
el caso de fermiones. Como vimos en la seccion 6.6 el calculo de la funcion particion canonica sobre
una base de estados totalmente simetricos o antisimetricos es bastante complicada. Por contraposicion, veremos que este calculo es extremadamente sencillo en el ensemble gran canonico. Este es un
buen ejemplo de como la equivalencia entre ensembles nos permite este tipo de flexibilidad.
Consideremos entonces un sistema de partculas no interactuantes y supongamos que conocemos
los autovectores y autovalores de una partcula
H1 |ki = k |ki
donde k representa un conjunto completo de n
umeros cuanticos para una partcula. Como vimos en
la seccion 6.6, con los mismos podemos construir una base de estados simetrizados |k1 , k2 , . . . , kN iS,A
de N partculas. As, podemos construir una base para cada subespacio de N partculas y la suma
directa de todas esas bases nos da una base para un sistema con un n
umero arbitrario de partculas.
Ahora bien, como tambien vimos en la seccion 6.6, el orden de los ndices en dichos estados es
completamente irrelevante. As, al sumar sobre todos los posibles valores de los ndices para calcular
la funcion particion, debimos descontar la repeticion de terminos. Por otra parte, la especificacion
P
de los n
umeros de ocupacion nk con k nk = N determina unvocamente cada estado simetrizado
de N partculas. As, si indexamos los autoestados simetrizados mediante los n
umeros de ocupacion
no necesitamos preocuparnos por la repeticion de terminos. Esto resulta particularmente util en el
P
caso del ensemble gran canonico, ya que ahora podemos levantar la restriccion k nk = N . Vamos
entonces a denotar por
|nk1 , nk2 , . . .iS,A
un estado simetrizado con nk1 partculas en el nivel k1 , nk2 partculas en el nivel k2 , etc, donde
los ndices k1 , k2 , . . . ahora corren sobre todos los posibles n
umeros cuanticos diferentes de una
partcula. Por ejemplo, el estado con nki = 1 y todos los demas n
umeros de ocupacion iguales
a cero corresponde al estado de una partcula |ki i; el estado simetrico con nki = 2 y todos los
demas n
umeros de ocupacion iguales a cero corresponde al estado de dos partculas |ki i |ki i; el
estado antisimetrico con nki = 1, nkj = 1 y todos los demas n
umeros de ocupacion iguales a cero
corresponde al estado de dos partculas
1
[|ki i |kj i |kj i |ki i]
2
y as sucesivamente. Dado que cada uno de estos estados esta unvocamente determinado por el
conjunto de valores de los n
umeros de ocupacion, podemos expresar
Z=

nk1 =0 nk2 =0

S,A

hnk1 , nk2 , . . .| e(HN ) |nk1 , nk2 , . . .iS,A

nk =0

con autovalores N = P nk . Ademas


Claramente, estos estados son autoestados de N
k

|nk , nk , . . .iS,A =
H
1
2

X
k

y as

nk k |nk1 , nk2 , . . .iS,A

(7.32)

98

)
(H
N

|nk1 , nk2 , . . .i

S,A

= exp

(k ) nk |nk1 , nk2 , . . .iS,A

En el caso de partculas de Bose-Einstein (BE) tenemos entonces que

ZBE (T, V, ) =

nk1 =0 nk2 =0

exp

nk =0

nk (k )

(7.33)

En el caso de partculas de Fermi-Dirac (FD) las funciones de onda no nulas son aquellas para
las cuales todos los n
umeros de ocupacion adoptan los valores cero o uno. La funcion gran particion
para el gas de FD tiene por lo tanto la forma:
1
X

ZF D (T, V, ) =

1
X

nk1 =0 nk2 =0

1
X

exp

nk =0

nk (k )

(7.34)

Finalmente, resulta ilustrativo considerar que ocurrira si tuvieramos un gas cuantico de partculas identicas distinguibles. En este caso no tendramos ninguna restriccion en los valores posibles de
los n
umeros de ocupacion, pero tenemos que tomar en cuenta que, dado un conjunto de n
umeros
de ocupacion fijos {nk }, el intercambio de dos partculas en dos autoestados arbitrarios diferentes
ki y kj , con n
umeros de ocupacion nki y nkj corresponde a un nuevo estado, diferente del anterior,
sin alterar los n
umeros de ocupacion y por lo tanto con el mismo factor exponencial. As, para cada conjunto de valores {nk }, debemos multiplicar dicho factor por el n
umero de combinaciones de
partculas entre estados diferentes. La funcion gran particion para un gas de partculas distinguibles
tiene entonces la forma

Zdist (T, V, ) =

nk1 =0 nk2 =0

X
nk =0

X
N!
exp
nk (k )
n k1 ! n kj ! n k !
k

(7.35)

donde el factor multinomial nos da el n


umero de posibles combinaciones de partculas distinguibles
P
correspondientes a un dado conjunto de n
umeros de ocupacion {nk } tales que k nk = N .
Como veremos en el proximo captulo, a temperaturas altas el n
umero medio de bosones en
cualquier estado k es muy peque
no, lo que siginifica que los u
nicos microestados que contribuyen
significativamente a la funcion gran particion son aquellos para los cuales todos los n
umeros de
ocupacion toman valores cero o uno. As, el comportamiento a altas temperaturas de ambos tipos
de partculas (bosones o fermiones) es el mismo. Las mismas consideraciones valen en el caso de
un gas de partculas distinguibles. En esa situacion, si comparamos las Eqs.(7.33) y (7.34) con la
Eq.(7.35) vemos que la u
nica diferencia reside en el factor N ! en la u
ltima, ya que nk ! = 1 para la
mayora de los n
umeros de ocupacion. As, el comportamiento de los gases ideales cuanticos a altas
temperaturas corresponde al de un gas de partculas distinguibles con la correccion de eliminar el
factor N !. Este es precisamente el contaje correcto de Boltzmann.
Un sistema de partculas cuya estadstica esta descripto por la funcion gran particion

ZM B (T, V, ) =

nk1 =0 nk2 =0

nk =0

nk1 ! nkj ! nk !

exp

nk (k )

(7.36)

se conoce como gas de Maxwell-Boltzmann (MB) y el mismo describe el comportamiento a altas


temperaturas de todos los gases ideales. Comparando con la Ec.(7.24) es facil ver que

99

ZM B (T, V, ) =

z N ZN (T )/N !

(7.37)

N =0

donde ZN (T ) es la funcion particion canonica de N partculas distinguibles.

7.4.

Gas ideal de Maxwell-Boltzmann

El gas de Maxwell-Boltzmann corresponde un sistema idealizado que describe el comportamiento


de altas temperaturas de los gases ideales cuanticos. Resulta un ejercicio interesante derivar una
vez mas las ecuaciones del gas ideal a partir de este modelo usando el ensamble gran canonico.
Precisamente la eliminacion del factor N ! de la Ec.(7.36) vuelve este problema sumamente facil de
resolver, ya que la funcion gran particion se factoriza de la forma:

ZM B (T, V, ) =

Y
k

h
i
1 nk (k ) Y

e
=
exp e(k )
n !
n =0 k
k

(7.38)

donde hemos usado el desarrollo en serie de Taylor de la funcion exponencial ex =


El potencial gran canonico resulta entonces

n
n=0 (1/n!)x .

M B (T, V, ) = kB T ln ZM B (T, V, )
= kB T

e(k )

= kB T z

ek

(7.39)

donde z es la fugacidad. El n
umero medio de partculas viene dado por

hN i =

M B

=
T,V

z ek

(7.40)

Tenemos ademas que


hN i =

hnk i

(7.41)

hnk i = z ek

(7.42)

de donde

es el n
umero medio de partculas en el autoestado k. Este resultado puede obtenerse directamente
calculando (1/ZM B ) Tr nk exp ((H N )).
Notemos que la suma sobre k en la Ec.(7.39) corresponde exactamente a la funcion particion
canonica de 1 partcula y as
M B (T, V, ) = kB T z Z1 (T )

(7.43)

La Ec.(7.43) es general para partculas no interactuantes con cualquier espectro. Vamos a restringirnos por simplicidad al caso de partculas u
nicamente con grados de libertad traslacionales.
Veremos al final de la seccion la generalizacion al caso que incluye otros grados de libertad, tales
como rotacionales, spin, etc.. En este caso la energa es puramente cinetica. Vamos a asumir ademas
que el gas se encuentra contenido en una caja c
ubica de lado L y vol
umen V = L3 con paredes

100
perfectamente reflectantes. Como vimos en la seccion 6.2, la funcion particion de una partcula en
este caso es Z1 = V /T3 , donde

2
h2
mkB T

!1/2

es la longitud de onda termica. As, la relacion fundamental para el gas de Maxwell-Boltzmann en


el ensemble gran canonico es

M B (T, V, ) = kB T

Vz
mkB T
= kB T V z
3
T
2
h2

3/2

(7.44)

De la Ec.(7.40) tenemos
hN i = zZ1 (T ) =

Vz
= M B
3T

(7.45)

De aqui podemos obtener el potencial qumico en funcion de la densidad de partculas y de T

hN i 3T
= kB T ln
V

(7.46)

La entropa del gas de Maxwell-Boltzmann viene dada por

M B
S=
T

=
V,

5kB

2
T

Vz
.
3T

(7.47)

Usando las Ecs.(7.45) y (7.46) podemos expresar S en funcion de T y hN i:

S=

5kB hN i
hN i 3
kB hN i ln
.
2
V T

(7.48)

Usando la Ec.(7.23) tenemos que


P =

kB T z
M B
hN i kB T
=
=
3
V
V
T

(7.49)

que es el resultado esperado para un gas ideal clasico. De las Ecs.(7.22) y (7.49) tenemos que la
energa interna viene dada por
U =

hN i
+ hN i .

(7.50)

Usando la Ec.(7.45) obtenemos entonces el resultado esperado


3
3
hN i kB T = P V
(7.51)
2
2
Veremos que esta u
ltima igualdad es valida para todos los gases ideales. Finalmente, reemplazando
la ecuacion anterior en la expresion (7.48), se reobtiene la formula de Sackur y Tetrode.
Supongamos ahora que tenemos un gas de moleculas no interactuantes. Sea (T ) la funcion
particion canonica de una molecula, correspondiente a los grados internos de libertad (rotacionales,
vibracionales, etc, todos excepto la energa cinetica), los cuales asumimos desacoplados de la energa
cinetica. De la Ec.(7.37) tenemos, en la aproximaci
on semiclasica, que
U=

Z=

(z (T ))N (Z1 (T ))N /N !

N =0

(7.52)

101
donde Z1 (T ) es la funcion particion canonica de una partcula libre puntual. Notemos que los
grados internos de libertad pueden ser absorvidos en la fugacidad, esto es, este sistema puede
pensarse como un gas ideal con un potencial qumico efectivo 0 (T ), tal que z z 0 = z (T ),
o 0 = + kB T ln (T ). As, el potencial gran canonico resulta
(T, V, ) = kB T z (T ) Z1 (T )

(7.53)

Ejercicios
1. Obtenga la Ec.(7.43) directamente de la expresion (7.37).
2. Muestre que para el sistema descripto por la Ec.(7.53) se cumple que
P V = hN i kB T

3
ln (T )
U = hN i kB T
+T
2
T

hN i 3T
= kB T ln
V (T )

7.5.

(7.54)

Adsorci
on en superficies

Supongamos que tenemos en contacto un material solido con un gas (o mas genericamente, un
fluido), en equilibrio a presion y temperatura constantes. Consideremos la interfase entre ambos
materiales (superficie del solido). A diferencia de los atomos (o moleculas) en el vol
umen, los
atomos en la superficie encuentran desbalanceadas sus interacciones con otros atomos del solido,
pudiendo por lo tanto atraer moleculas del gas. Se define como adsorci
on al fenomeno en el cual
moleculas del adsorbato (el gas) se ligan a la superficie del solido. El termino adsorcion debe
distinguirse del termino absorci
on, el cual describe la situacion en la cual las moleculas del gas
penetran en el vol
umen, llenando poros del solido. En la adsorcion las moleculas del adsorbato
quedan ligadas a sitios fijos de la superficie e incluso puede ocurrir desorci
on, el proceso inverso.
En equilibrio termodinamico, se adsorver
an tantas moleculas como se desorver
an y la concentraci
on
de adsorbato en la superficie del solido permanecera constante. El resultado final de este proceso
es la formacion de una pelcula lquida o gaseosa en la superficie del material. Estos procesos son
de enorme importancia industrial en la actualidad, siendo algunos de los adsorbentes mas comunes
el carbon activado y la slica gel.
El proceso de adsorcion es en general complejo, pero podemos tener una idea general del comportamiento termodinamico caracterstico a traves de un modelo idealizado introducido por Irving
Langmuir en 1916. El mismo contituye un buen ejemplo de aplicacion del ensemble gran canonico
clasico. El modelo se basa en suponer (a) que las moleculas del adsorbato se adsorven en stios fijos
de la superficie, los cuales denominaremos sitios de adsorcion o trampas, (b) que cada sitios puede
adsorver a lo sumo una molecula, (c) que las moleculas adsorvidas no interact
uan entre s y (d) que
el gas se comporta como un gas ideal.
Dado que la superficie del solido (sistema de trampas) se encuentra en equilibrio con el gas,
podemos pensar que este u
ltimo act
ua como un reservorio de partculas para la primera. El procedimiento consiste entonces en calcular las ecuaciones de estado para el sistema de trampas y luego
imponer las condiciones de equilibrio termodinamico con el gas.
Supongamos entonces que tenemos M sitios de adsorcion y sea la energa de ligadura de
una molecula ( es la energa necesaria para evaporar una molecula del adsorbato ligada a la

102
superficie). Supongamos ademas que una molecula tiene grados internos de libertad. Sea (T ) la
funcion particion canonica para los grados internos de libertad de una molecula. La funcion gran
particion para el sistema de trampas viene dada entonces por
ZM =

M
X

z N ZN (T )

N =0

donde ZN es la funcion particion canonica para N moleculas adsorvidas. El contaje correcto de


Boltzmann no se incluye en este caso, ya que las trampas son distinguibles. Dado que las moleculas
adsorvidas son independientes, tenemos que

ZN (T ) = g(N ) (Z1 (T ))N = g(N ) e (T )

donde g(N ) es el n
umero de maneras de acomodar N moleculas en M trampas. As
ZM =

M
M!
z e (T )
= 1 + z e (T )
N !(M N )!
N =0
M
X

(7.55)

Alternativamente, podemos derivar la ecuacion anterior como sigue. Como ya vimos, los grados
internos de libertad pueden ser absorvidos en la fugacidad, reemplazando z z 0 = z (T ). Cada
trampa puede pensarse como una sistema de dos estados: con molecula adsobida o vacia, con
energas y cero respectivamente. As, podemos asociar a cada trampa un n
umero de ocupacion
ni = 0, 1, tal que cero y uno representan los estados de la trampa i-esima con molecula y sin
molecula adsorvida respectivamente. El Hamiltoniano de este sistema puede entonces escribirse
P
PM
como H = M
on gran particion puede escribirse como
i=1 ni y N =
i=1 ni La funci
0

ZM = Tr e(H N ) =

n1 =0,1

ni (+0 )

= 1 + e(+ )

nM =0,1

de donde resulta la Ec.(7.55). El n


umero medio de partculas adsorvidas viene dado por
hN i = z

ln ZM
z e (T )
=M
z
1 + z e (T )

Se define el cubrimiento de la superficie como la fraccion de moleculas adsorvidas. As


=

z e (T )
1 + z e (T )

(7.56)

La condicion de equilibrio termodinamico entre el solido y el gas es la igualdad entre sus potenciales
qumicos. De la Ec.(7.54) tenemos que
z (T ) =

hN i 3T
P 3T
=
V
kB T

y por lo tanto
=

P
P0 + P

(7.57)

donde
P0 =

kB T
e
3T

La Ec.(7.57) se conoce como isoterma de Langmuir. Para P/P0 1, el cubrimiento se comporta


como P/P0 y 1 para P/P0 1.

Captulo 8

Gases ideales de Bose-Einstein


La funcion gran particion (7.33) para el gas ideal de Bose-Einstein puede escribirse como

ZBE (T, V, ) =

nk (k )

nk =0

(8.1)

1 e(k )

n
donde hemos usado que
n=0 a = 1/(1 a); como veremos enseguida, k 0, con lo cual
resulta valido usar este resultado. El potencial gran canonico resulta entonces

BE (T, V, ) = kB T ln ZBE (T, V, ) = kB T

ln 1 e(k )

(8.2)

de donde podemos calcular

BE
hN i =

=
T,V

e(k )
1 e(k )

1
e(k ) 1

(8.3)

Recordando que
hN i =

hnk i

(8.4)

tenemos entonces que el n


umero medio de partculas en el estado k es

hnk i =

e(k ) 1

z 1 ek 1

(8.5)

Dado que hnk i 0 tenemos que e(k ) 1 y por lo tanto k 0 k.

8.1.

La condensaci
on de Bose-Einstein

Supongamos por simplicidad que tenemos partculas libres en una caja de vol
umen V = L3 con
condiciones de contorno periodicas, esto es, las funciones de onda de una partcula deben satisfacer
k (x + L, y + L, z + L) = k (x, y, z). Las autofunciones en estas condiciones son ondas planas
normalizadas de la forma:
~k (~r) =

1
L3/2

eik.~r

donde los autovalores del operador vector de onda vienen dados por
ki =

2
ni
L
103

i = x, y, z

104
con ni = 0 1, 2 . . . y donde los autovalores de la energa son (~k) = h
2 k 2 /2m. La suma sobre
autoestados corresponde en este caso a
X

(8.6)

nx =0,1,... ny =0,1,... nz =0,1,...

Reescribiendo la suma (8.6) como


X

V
(2)3

kx ky kz

(8.7)

kx =0,2/L,... ky =0,2/L,... kz =0,2/L,...

donde ki = 2/L, podemos aproximar en el lmite termodinamico L :


X
k

V

(2)3

4V
d k =
(2)3
3

Z
0

k 2 dk

(8.8)

donde la u
ltima igualdad vale solo si el integrando es funcion u
nicamente de k = |~k|.
En este sistema el mnimo valor del espectro de una partcula corresponde al estado con ~k = 0,
0 = 0. Esto implica que 0 y por lo tanto 0 z 1. Reemplazando las sumas por integrales
(en el lmite termodinamico) en la Ec.(8.3) tenemos
hN i =

4V
(2)3

Z
0

k2 z

4V
dk =
2 2

eh k /2m z

mkB T
2
h2

3/2 Z
0

x2

z
dx
2
x
e z

(8.9)

de donde la densidad de partculas hN i /V resulta


1
g (z)
3T 3/2

(8.10)

La funcion g3/2 (z) se define como


4
g3/2 (z) =

Z
0

X
zk
z
dx
=
k 3/2
ex2 z
k=1

(8.11)

la cual es un caso particular de la familia de funciones gn (z) definidas como


gn (z) =

X
zk
k=1

kn

(8.12)

Estas funciones se han sido sumamente estudiadas y se encuentran tabuladas en la literatura. La


funcion (8.11) es acotada y monotona creciente de z para todo 0 z 1, y toma los valores lmites:
g3/2 (0) = 0

g3/2 (1) =

X
k=1

1
k 3/2

= (3/2) = 2,612 . . .

donde (x) es la funcion zeta de Riemann. La derivada de g3/2 (z) diverge para z 1 y para valores
peque
nos de z vemos, del desarrollo en serie (8.11), que g3/2 (z) z (ver Fig.8.1).

105

g3/2(z)
g5/2(z)

2.612

1.342
1

0
0.0

.5

1.0

z
Figura 8.1: Funciones g3/2 y g5/2 .
La ecuacion
3T = g3/2 (z)
es una ecuacion implcita para z en funcion de y T . Pero el producto 3T puede tomar cualquier
valor arbitrariamente grande para temperaturas suficientemente bajas y/o altas densidades. De
manera que para 3T > 2,612 no existe solucion a esta ecuacion, ya que z no puede ser mayor
que uno. Evidentemente esta es una region singular de las funciones termodinamicas, lo cual nos
esta se
nalando la existencia de una transicion de fase, y claramente para 3T > 2,612 algo esta
incorrecto en nuestros calculos previos.
Podemos darnos cuenta de donde esta el problema si revisamos con mas cuidado las Ecs.(8.3) y
(8.5). El termino en la suma (8.3) correspondiente al estado fundamental ~k = 0, esto es, el n
umero
de medio de partculas hn0 i en el estado con 0 = 0 es divergente cuando z 1 (o 0):

hn0 i =

z
1z

z1

(8.13)

Esto significa que el estado fundamental 1 tiene una ocupacion macroscopica cuando z 1 en el
lmite termodinamico, en el cual el n
umero medio de partculas tambien diverge, ya que exigimos
que la densidad sea finita. Vemos entonces que en el calculo anterior hemos perdido este efecto.
Como es posible que aparezca una singularidad en las ecuaciones termodinamicas? La respuesta
esta en el lmite termodinamico y veremos que el error en los calculos estuvo en la manera en que
tomamos este lmite.
Vamos entonces a recalcular hN i en el lmite V , pero aislando el termino divergente de la
suma (8.3), esto es, vamos a aproximar
1

El estado fundamental = 0 no necesita ser el estado con p


~ = 0. Este valor surge en particular para las condiciones
de contorno peri
odicas. En general vamos a tener este fen
omeno cualquiera sea el estado fundamental, el cual podemos
asumir siempre = 0, ya que el cero de la energa esta indefinido para las soluciones de la Ec. de Schr
odinger. As,
si 0 6= 0 podemos restar a todos los niveles el valor 0 y redefinir el potencial qumico 0 = 0 .

106

z
4V
hN i =
+
1 z (2)3

Z
2/L

k2 z

4V
z
dk =
+ 3
2 2

h
k
/2m
1 z T
e
z

Z
T

/L

z
dx
2
x
e z

(8.14)

De la misma manera podemos reescribir el potencial gran canonico como


Z

BE

2 2
4kB T V 2
k ln (1 zeh k /2m )dk
= kB T ln (1 z) +
(2)3
2/L
Z
4kB T V
2
= kB T ln (1 z) + 3
x2 ln (1 zex )dx.

T T /L

(8.15)
(8.16)

Las integrales (8.14) y (8.16) excluyen una esfera de radio 2


h/L alrededor del origen, lo cual
corresponde a sumar a partir de los primeros estados exitados con k = 2k/L. Podemos entonces
escribir las ecuaciones de estado de la siguiente manera:

!
hN i
1 z
1
T
=
=
+
g (z) I z,
V
V 1 z 3T 3/2
L

(8.17)

!
BE
kB T
kB T
T
P =
=
ln (1 z) + 3 g5/2 (z) Ip z,
V
V
L
T

(8.18)

donde
4
g5/2 (z) =

Z
0

x2

x ln (1 ze

k=1

4
I (z, a) = 3
T
4kB T
Ip (z, a) = 3
T

)dx =

X
zk

Z a
0

Z a
0

k 5/2

(8.19)

z
dx
2
x
e z
2

x2 ln (1 zex )dx.

(8.20)

(8.21)

La funcion g5/2 (z) es tambien monotona creciente y toma los valores g5/2 (0) = 0 y g5/2 (1) =
(5/2) = 1,342 . . . (ver Fig.8.1).
Las integrales (8.20) y (8.21) se anulan en el lmite L para todo valor de z, excepto tal vez
para z = 1, en el cual los respectivos integrandos son singulares. Desarrolando en serie de potencias
el termino exponencial en ambos integrandos es facil ver que
lm I (1, a) = lm Ip (1, a) = 0.

a0

a0

(8.22)

Analicemos entonces la nueva ecuacion para la densidad


=

1
1 z
+ 3 g3/2 (z)
V 1 z T

(8.23)

107
1.0

V = 10
V = 100
V = 1000

1 z
V 1 z

.5

0.0
0.0

.5

1.0

Figura 8.2: Comportamiento del primer termino de la Ec.(8.23) s para diferentes valores de V .
El comportamiento del primer termino de la Ec.(8.23) se muestra en la Fig.8.2 para diferentes
valores de V . Tenemos entonces que resolver la ecuacion implcita para z:
3T =

3T z
+ g3/2 (z)
V 1z

(8.24)

la cual puede resolverse graficamente para cualquier par de valores de y T como se muestra en
al Fig.8.3a. Vemos que para V finito la divergencia del lado derecho de la Ec.(8.24) cuando z 1
impide que la raiz de dicha ecuacion alcance el valor z = 1 para cualquier valor finito de T y .
Para T 0 y tenemos que z 1 y por lo tanto hn0 i , lo cual es esperable, ya que
en esas condiciones todas las partculas estaran en el estado fundamental 2 . La solucion de z en
funcion de 3T para un gas contenido en un vol
umen V finito se muestra en la Fig.8.3b.
Supongamos ahora V finito, pero grande: V 1. Para 3T < 2,612 las soluciones de la Ec.(8.10)
tienden a las de la Ec.(8.23) cuando V . Para 3T 2,612 tenemos que las raices de la Ec.(8.24)
seran cercanas a z = 1. Asi, podemos aproximar
3T

3T z
+ g3/2 (1)
V 1z

de donde podemos despejar


z(V )

0 V
1
1
=
1 1 V
1 + 0 V
1 + 0 V
0

(8.25)

donde 0 es una cantidad de que no depende de V . Asi, vemos que todas las soluciones para
3T 2,612 tienden a z = 1 cuando V . La fugacidad del gas ideal de Bose-Einstein, en el
lmite termodinamico, es por lo tanto
2

Este lmite tiene que ser tomado conjuntamente para que z 1. Si tomamos el lmite T 0 manteniendo
finita, el primer termino del lado derecho de la Ec.(8.24) tambien diverge, provocando que z tienda a un valor finito
tal que hn0 i hN i = V .

108

z
5

1
O
V

1
O
V
3

3T z
+ g3/ 2 (z)
V 1 z

2.612
1


3
T

g3/ 2 (z)
0

0
0.0

.5

0.0

1.0

.5

1.0

1.5

2.0

2.5

3.0

2.612

z
V 1 z
3
T

3.5

4.0

3T

Figura 8.3: (a) Solucion grafica de la Ec.(8.24). (b) Fugacidad de un gas ideal de Bose-Einstein
contenido en un vol
umen finito V .
(

z=

1
la raiz de 3T = g3/2 (z)

si
si

3T g3/2 (1)
3T < g3/2 (1)

0
0

si
si

(8.26)

y se muestra en la Fig.8.4.
De la Ec.(8.25) tenemos ademas que

lm

1 z(V )
V 1 z(V )

hn0 i
= lm
=
V V

3T g3/2 (1)
3T < g3/2 (1)

(8.27)

y por lo tanto de la Ec.(8.23) tenemos que la densidad media de partculas tiene satisface

1
1 0 + 3T g3/2 (1)
= =
v 13 g3/2 (z)

si

3T g3/2 (1)

si

3T < g3/2 (1)

(8.28)

donde z viene dado por (8.26) y v es el vol


umen por partcula.
umero macrosc
opico de partculas ocupan el estado
Vemos entonces que para 3T g3/2 (1) un n
fundamental 0 . Este fenomeno se conoce como condensaci
on de Bose-Einstein y comienza a
ocurrir cuando z 1 (o, equivalentemente, cuando 0), es decir, cuando la densidad y la
temperatura T son tales que
3T = g3/2 (1).

(8.29)

La Ec.(8.29) nos permite obtener la temperatura crtica Tc de la transicion en funcion de la densidad:


3Tc =

g3/2 (1)

(8.30)

109
2

0
0

3T

2.612

Figura 8.4: Fugacidad de un gas ideal de Bose-Einstein en el lmite termodinamico.


de donde

Tc =

2h2
mkB

g3/2 (1)

!2/3

(8.31)

Tambien podemos invertir la ecuacion (8.31) y exresar el vol


umen expecfico crtico en funcion de
T:

vc =

2
h2
mkB

!3/2

g3/2 (1)
T 3/2

(8.32)

De la Ec.(8.28) podemos obtener la fraccion de partculas en el estado fundamental para la


region de condensacion z = 1, manteniendo fija la densidad y variando la temperatura:
1=

0
1
+ 3 g3/2 (1)

(8.33)

3
hn0 i
0
1
=
= 1 3 g3/2 (1) = 1 T3c = 1
hN i

T
T

T
Tc

3/2

(8.34)

Asi, podemos definir una parametro de orden para la transicion como

hn0 i
1

=
0
hN i

T
Tc

3/2

si
si

T Tc
T > Tc

(8.35)

el cual se muestra en la Fig.8.5. Para T Tc tenemos que

Tc T
Tc

(8.36)

110

0
0

T / Tc

Figura 8.5: Parametro de orden = hn0 i / hN i vs. temperatura reducida.


Esto nos sugiere que la transicion es de segundo orden. No obstante, no es posible encuadrar
esta transicion dentro de la clasificacion usual de primer y segundo orden. En particular, el calor
especfico no es divergente en el punto crtico, si bien presenta un comportamiento anomalo. Mas
a
un, veremos que desde cierto punto de vista podra interpretarse como una transicion de primer
orden.
Notemos que si mantenemos fija la temperatura y variamos la densidad, podemos expresar
tambien la fraccion de partculas en el estado fundamental a partir de las Ecs.(8.28) y (8.34) como
hn0 i
c
v
=1
=1
(8.37)
hN i

vc
Vamos a calcular entonces las restantes funciones termodinamicas. Consideremos la expresion
(8.18) para la presion. Es evidente que lmV (1/V ) ln (1 z) = 0 para todo z 6= 1. Ademas, de
la Ec.(8.25) tenemos que

1
lm
ln (1 z(V )) = 0
V V
Asi, reemplazando las Ecs(8.22), (8.26) y (8.38) en (8.18) tenemos que
P =

kB3T g5/2 (1)

si

3T g3/2 (1)

si

3T < g3/2 (1)

T
kB T
g (z)
3T 5/2

(8.38)

(8.39)

Notemos que la presion es independiente de la densidad para 3T g3/2 (1).


Analicemos ahora las isotermas del gas de Bose-Einstein en el espacio de parametros (P, v). A
temperatura constante tenemos un punto de transicion P = Pc (vc ) que se obtiene de tomar z = 1
en la Ec.(8.39) y expresar T en funcion de v a traves de la Ec.(8.32). Variando T se define entonces
una linea de transicion
Pc (vc ) =

2
h2 g5/2 (1) 1
m(g3/2 (1))5/3 vc5/3

(8.40)

111

T3
T2
T1

Yc(T2)

Figura 8.6: Grafico esquematico de las isotermas de gas ideal de Bose-Einstein para tres temperaturas diferentes T1 < T2 < T3 . La linea de trazos corresponde a la curva Pc (vc ).

En la Fig.8.6 podemos ver la forma general de las isotermas. Para v < vc (T ) tenemos que
P = Pc = cte. Esto recuerda fuertemente las isotermas de la trasicion usual gas-lquido en la region
de coexistencia. Mas a
un, dado que el estado condensado consiste en una mezcla de un conjunto
macroscopico de partculas en el estado fundamental y otro conjunto distribuido en el resto de
los niveles (la fraccion de partculas en cualquier otro nivel individual tiende cero en el lmite termodinamico). De esta manera podemos interpretar dicho estado como una coexistencia entre una
fase gaseosa y una fase condensada, si bien esta u
ltima correspondera a una condensacion en el
espacio de los momentos. A partir de esta consideraciones suele interpretarse a veces la condensacion de BE como una transicion de primer orden. Si aceptamos esta interpretaci
on tenemos que
preguntarnos entonces cual es el vol
umen especfico de la fase condensada. Comparando la Fig.8.6
con el diagrama de consistencia de la transicion gas-lquido todo indica que el vol
umen especfico del
condensado es cero y el del gas es v = vc . Pero esto esto significa que el condensado tiene densidad
infinita! Sin embargo este aspecto no-fsico es consistente con el hecho de que estamos considerando
un gas de partculas no-interactuantes, lo cual implica que las partculas pueden acercarse entre
ellas a distancias arbitrariamente peque
nas. Mas a
un, veremos que esta interpretaci
on, mas alla del
aspecto no fsico expuesto, es bastante consistente.
Consideremos por ejemplo la presion crtica en funcion de la temperatura, esto es
Pc (T ) =

kB T
g (1) (kb T )5/2
3T 5/2

(8.41)

De acuerdo a la interpretacion anterior, esta funcion, la cual se muestra en la Fig.8.7, correspondera


a la curva de presion de vapor de la transicion, es decir, a una curva de coexistencia. Sin embargo
notemos que nunca podemos atravesar la curva. Nunca podemos tener una fase condensada pura,
excepto a T = 0. Derivando la Ec.(8.41) tenemos

112

Pc(T)

gas

Figura 8.7: Linea de coexistencia Pc (T ).

dPc (T )
5 kB g5/2 (1)
1
=
=
3
dT
2
T vc
T

g5/2 (1)
5
kB T
2
g3/2 (1)

(8.42)

La Ec.(8.42) correspondera la ecuacion de Clausius-Clapeyron para la transicion. Dado que v =


vc , esto implica un calor latente de la forma
l=

g5/2 (1) 5
kB T.
g3/2 (1) 2

(8.43)

Calculemos ahora la entropa por unidad de vol


umen. Tenemos que
s = lm
V

1
V

BE
T

= lm
V,

P
T

(8.44)
V,

Derivando entonces la Ec.(8.39) y usando la propiedad


1
dgn (z)
= gn1 (z)
dz
z

(8.45)

tenemos que
s=

5 kB
3 g5/2 (1)

2 T
5 kB
2 3T g5/2 (z)

kB ln (z)

si

3T g3/2 (1)

si

3T < g3/2 (1)

(8.46)

Vemos que s = 0 a T = 0, de acuerdo con la tercera ley de la termodinamica. Hemos visto


ademas que la fase condensada pura solo existe a T = 0. De aqui concluimos que el condensado
tiene entropa cero, lo cual es consistente con una fase en la cual todas las partculas se encuentran
en el mismo estado cuantico. Asi, a temperatura finita, la contribuci
on a la entropa en la region de
coexistencia viene dada exclusivamente por la fraccion de partculas en la fase gaseosa. Si llamamos
s0 a la entropa por partcula del sistema y s0g a la entropa por partcula en la fase gaseosa, tenemos
que

113

hn0 i 0
v
s = 1
sg = s0g
hN i
vc
0

(8.47)

donde hemos usado la Ec.(8.37). De la Ec.(8.46) tenemos que en la region de coexistencia


s0 = lm

S
5 kB
= vs =
g (1) v
hN i
2 3T 5/2

(8.48)

Comparando las dos u


ltimas ecuaciones, y teniendo en cuenta que la entropa de la fase condensada
es cero, tenemos que la diferencia de entropa entre la fase gaseosa y la condensada es
s = s0g =

5 kB
5 g5/2 (1)
g5/2 (1) vc =
kB
3
2 T
2 g3/2 (1)

(8.49)

Comparando con la Ec.(8.43) vemos que


l = T s

(8.50)

lo cual es consistente con la interpretacion de una transicion de primer orden. Finalmente, es posible
ver que la compresibilidad isotermica T cuando v vc . Dado que las isotermas son planas
en la region de coexistencia, T = en toda la region de coexistencia, lo cual es consistente con
la imagen de un fluido infinitamente compresible.
Mas alla de cualquier interpretacion, es claro que los aspectos no fsicos del gas ideal de BoseEinstein son un resultado de despreciar las interacciones entre partculas. Mas a
un, el efecto mas
interesante, esto es, la condensacion, aparece cuando

1/3
T
=
g
(1)
1,377
3/2
v 1/3

esto es, cuando la longitud de onda de deBroglie promedio es del orden de la distancia media entre
partculas. En esta situacion las interacciones entre partculas en general no pueden ser despreciadas. Modelos mas realistas que toman en cuenta interacciones repulsivas entre partculas a cortas
distancias muestran que la condensacion persiste, pero los efectos no fsicos (isotermas planas)
desaparecen. En este caso la transicion de fase es claramente de segundo orden.
Asi, las predicciones mas importantes del gas ideal de Bose-Einstein son: (a) Es posible tener una
transicion de fase como resultado exclusivamente de la estadstica, a diferencia de otras transiciones
de fase que son un resultado exclusivamente de las interacciones entre partculas; (b) la fase de bajas
temperaturas corresponde a un estado cu
antico coherente macrosc
opico. Esto u
ltimo implica
que propiedades cuanticas, las cuales usualmente solo son observables a escalas microscopicas,
puedan ser observadas a escalas macroscopicas.
A partir de la expresion (8.46) podemos calcular el calor especfico a densidad constante mediante la expresion

c = T

s
T

(8.51)

Notemos que para calcular c tenemos que mantener constante en lugar de . Asi, vamos a tener
que calcular

z
T

3 z g3/2 (z)
2 T g1/2 (z)

(8.52)

114
16

g1/2(z)
14

12

10

0
0.0

.5

1.0

Figura 8.8:
la cual se obtiene derivando la ecuacion 3T = g3/2 (z) con respecto a T manteniendo = cte; la
funcion g1/2 (z) se muestra en la Fig.8.8. Usando esta expresion obtenemos

kB
15
4 3T g5/2 (1)
c =
9 g3/2 (z)
15 kB
3 g5/2 (z) kB
4 T

4 g1/2 (z)

si

3T g3/2 (1)

si

3T < g3/2 (1)

(8.53)

El calor especfico en funcion de T se muestra en la Fig.8.9. Notemos que g1/2 (z) para
z 1 y por lo tanto c es continua en el punto crtico, mientras que su derivada es discontinua. A
altas temperaturas c se hace constante, tal como se espera en un gas clasico. Vemos que tanto c
como s tienden a cero cuando T 0 de acuerdo con la tercera ley de la termodinamica, con una
dependencia en T de la forma T 3/2 .
Finalmente, la energa interna por unidad de vol
umen puede calcularse a partir de la Ec.(7.22)
obteniendose:

U
u = lm
=

V V

3
2
3
2

kB T
g (1)
3T 5/2
kB T
g (z)
3T 5/2

si

3T g3/2 (1)

si

3T < g3/2 (1)

(8.54)

Notemos que u = 32 P , al igual que en el gas de Maxwell-Boltzmann, a


un en la region de condensacion.
A altas temperaturas o bajas densidades, esto es cuando

1/3
T

g
(1)
3/2
v 1/3

tenemos que z 0 y g5/2 (z) g3/2 (z) g1/2 (z) z. De la Ec.(8.28) obtenemos para la densidad

z
3T

(8.55)

115
3.0

2.5

C / (kB)

2.0

1.5

1.0

.5

0.0

Tc

Figura 8.9: Calor especfico a densidad constante en funcion de la temperatura para el gas ideal de
Bose-Einstein.
mientras que de la Ec.(8.39) obtenemos para la presion
P

kB T z
hN i kB T
= kB T =
3
V
T

(8.56)

15 kB z 9
3
kB = kB
3
4 T
4
2

(8.57)

y de la Ec.(8.53) tenemos que


c

Vemos que a altas temperaturas y/o bajas densidades el gas de Bose-Einstein se comporta como
un gas ideal clasico, esto es, los efectos de la estadstica se vuelven despreciables.

8.2.

Radiaci
on de cuerpo negro

Consideremos las propiedades de equilibrio de una cavidad de vol


umen V vaca de materia, a
temperatura T . Un sistema de este tipo se conoce como cuerpo negro y puede producirse experimentalmente evacuando una cavidad en cualquier material y colocando la misma en contacto con
un reservorio a temperatura T . Los atomos en las paredes de la cavidad van a emitir y absorver
permanentemente radiacion electromagnetica, de manera que en equilibrio habra en la cavidad radiacion de diversas frecuencias con diferentes intensidades. En efecto, se observa que la distribucion
de energa en funcion de la frecuencia resulta independiente del tiempo y de las caractersticas de la
cavidad. En otras palabras, las propiedades del campo electromagetico en el interior de la cavidad
son independientes del tiempo y de la historia de la muestra y por lo tanto este sistema se encuentra
en equilibrio termodinamico.
Si bien hemos desarrollado el formalismo de la mecanica estadstica para sistemas de partculas,
no existe en principio impedimento alguno para extenderlo al campo electromagnetico. Lo primero
que debemos preguntarnos es cuales son los microestados accesibles del campo electromagnetico. Ya
hemos tratado un sistema semejante en el tratamiento cuantico de un sistema de partculas en una

116
caja, esto es ondas de materia. Al igual que en dicho caso, los microestados del presente sistema en
equilibrio corresponden a ondas estacionarias, esto es, a los modos del campo electromagnetico en la
cavidad. Sin embargo, para que podamos aplicar el formalismo de la mecanica estadstica debemos
formular dichas soluciones de las ecuaciones de Maxwell en terminos de variables canonicas. En
otras palabras, debemos expresar las ecuaciones del campo en terminos de coordenadas y momentos
generalizados que satisfagan las ecuaciones de Hamilton.
Si el vol
umen de la cavidad es suficientemente grande, puede verse a partir de consideraciones
termodinamicas, que las propiedades termodinamicas de la radiacion en la cavidad son independientes de la naturaleza de la cavidad (forma, composicion qumica, etc). De esta manera, podemos
elegir para el campo de radiacion las condiciones de contorno que nos resulten mas convenientes.
Supongamos entonces que tenemos un cubo de lado L con condiciones de contorno periodicas.
Consideremos la energa del campo electromagnetico en el interior de la cavidad:
1
H=
8

Z
V

~2 + H
~ 2 dV
E

(8.58)

~ y H
~ son funciones de la posicion y del tiempo. Los mismos obedecen la
donde los campos E
ecuaciones de Maxwell en ausencia de fuentes:
~
~ = 1 H
E
c t
~ = 0
.E
~
~ = 1 E
H
c t
~
.H = 0

(8.59)
(8.60)
(8.61)
(8.62)

~ y del potencial escalar como


Si expresamos los campos en terminos del potencial vector A
~ =A
~
H

(8.63)

~
~ = 1 A
E
(8.64)
c t
las ecuaciones (8.59) y (8.62) se satisfacen automaticamente. Notemos sin embargo que los potenciales se encuentran definidos a menos de una transformacion de gauge, esto es, si introducimos
nuevos potenciales
~A
~
A

1
c t

~ y H.
~ Esta arbidonde es una funcion arbitraria, obtenemos exactamente los mismos campos E
~ nos permite imponer la condicion de transversalidad
trariedad en la definicion de A
~ = 0.
.A

(8.65)

conocidad como gauge de Coulomb. Dado que no hay cargas en la cavidad podemos tomar = 0.
As, las ecuacion (8.60) se statisface automaticamente y la Ec.(8.61) nos da la ecuacion de ondas
para el potencial vector
~
1 2A
=0
(8.66)
c2 t2
La solucion general de la Ec.(8.66) para la caja con condiciones de contorno periodicas tiene la
forma
~
2 A

117
Xh

~a~k exp i(~k)t + i~k.~r + c.c.

~=
A

(8.67)

~k

donde las componentes del vector de onda vienen dadas por ki = 2li /L con i = x, y, z y li =
0, 1, 2; la frecuencia satisface la relacion de dispersion
(~k) = c|~k|

(8.68)

y c.c. indica el complejo conjugado del termino anterior. Los coeficientes ~a~k se determinan a partir
de las condiciones iniciales. La condicion de transversalidad (8.65) implica que
~k.~a~ = 0.
k

(8.69)

~ yH
~ vienen dados entonces por
Los campos E

i
~
Xh
~ = 1 A =
E
ik~a~k exp i(~k)t + i~k.~r + c.c.
c t
~

(8.70)

~ =A
~=
H

Xh

i(~k ~a~k ) exp i(~k)t + i~k.~r + c.c.

(8.71)

~k

esto es, tenemos un desarrollo en ondas planas de los campos. Usando la propiedad
Z

exp i(~k ~k 0 ).~r dV = V ~k,~k0

(8.72)

es facil demostrar que


Z
V

E 2 dV =

Xh

V k 2~a~k .~a~k exp 2i(~k)t V k 2~a~k .~a~k exp 2i(~k)t + 2V k 2~a~k .~a~k

~k

(8.73)

De la misma manera usando las propiedades del producto vectorial mixto y la transversalidad de
los campos, se puede demostrar que
Z
V

H 2 dV =

Xh
~k

V k 2~a~k .~a~k exp 2i(~k)t + V k 2~a~k .~a~k exp 2i(~k)t + 2V k 2~a~k .~a~k

(8.74)

Por lo tanto tenemos que


1
H=
8

8.2.1.

Z
V

X
~2 + H
~ 2 dV = V
E
k 2~a~k .~a~k
2 ~

(8.75)

Soluci
on cl
asica

Notemos que la expresion (8.75) para la energa no es un Hamiltoniano, ya que la misma


no se encuentra expresada en terminos de variables canonicas, esto es, coordenadas y momentos
generalizados que satisfagan las ecuaciones de Hamilton. Asi, no podemos aplicar en la presente
forma el formalismo de la mecanica estadstica clasica.
Definimos entonces las coordenadas generalizadas:
h

~ ~ (t) = ~a~ exp i(~k)t + ~a exp i(~k)t


Q
~k
k
k

donde es una constante real a determinar, y los momentos generalizados

(8.76)

118
h

i
d ~

~
~
~
~
P~~k (t) = Q
(t)
=

i(
k)~
a
exp
i(
k)t

i(
k)~
a
exp
i(
k)t
~
~k
~k
dt k
De las Ecs.(8.76) y (8.77) podemos expresar

1 i(~k)t ~
i ~
~a~k =
e
Q~k
P~
2
(~k) k

(8.77)

(8.78)

Reemplazando la Ec.(8.78) en (8.75) tenemos que


H=

i
Xh
V
~ 2 + (~k)2 Q
~2
P
~k
~k
82 c2 ~

(8.79)

Es facil ver que eligiendo


s

V
4c2

(8.80)

las coordenadas y momentos genearalizados (8.76) y (8.77) satisfacen las ecuaciones de Hamilton:
H
d ~
Q~k =
dt
P~~k

H
d ~
P~k =
~~
dt
Q

(8.81)

Ahora si, al disponer de una froma canonica podemos aplicar el formalismo de la mecanica
estadstica clasica. Es importante notar que la transversalidad de los campos impone que
~ ~ .~k = P~~ .~k = 0
Q
k
k

(8.82)

~ ~ y P~~ son normales a la direccion de propagacion de la onda dada por el


esto es, los vectores Q
k
k
vector ~k, y por lo tanto el Hamiltoniano (8.79) puede escribirse como
H=

i X
1 Xh 2
P~k,j + (~k)2 Q~2k,j =
H~k,j
2~
~
k,j

(8.83)

k,j

donde el ndice j = 1, 2 corresponde a las dos diferentes direcciones de polatrizacion lineal de la


onda y H~k,j es el Hamiltoniano de un oscilador armonico unidimensional de frecuencia (~k) = ck.
Dado que estamos a temperatura constante, podemos trabajar en el ensamble canonico. La funcion
particion tiene entonces la forma
Z=

YZ Z

~k,j

dQ~k,j dP~k,j e

H~k,j

(8.84)

Usando
Z

r
ax2

dx =

(8.85)

tenemos que
ln Z =

X
~k,j

ln

2
kc

(8.86)

de donde obtenemos la energa interna:


Z
U
1
1 X1
1 1
=
ln Z =
=2
d3 k
V
V
V ~
(2)3
k,j

(8.87)

119
Esta divergencia se conoce como cat
astrofe ultravioleta. Sea u() la densidad espectral de energa,
esto es, la cantidad de energa por unidad de vol
umen del campo electromagnetico con frecuencia
entre y + d. Tenemos entonces que
U
=
V

Z
0

u()d

(8.88)

De la Ec.(8.87) podemos escribir, al menos formalmente,


U
1
= 3 kB T
V
4

Z
0

8
kB T
c3

4k 2 dk =

Z
0

2 d

(8.89)

donde
1 ~
ck
(k) =
2
2
Comparando las ecuaciones anteriores obtenemos:
=

(8.90)

8
kB T 2
c3
Esta ecuacion se conoce como ley de Rayleigh-Jeans.
u() =

8.2.2.

(8.91)

Soluci
on cu
antica: la ley de radiaci
on de Plank

Lo que acabamos de ver fue el comienzo de la mecanica cuantica. La densidad espectral de


energa haba sido medida con gran precision a fines del siglo XIX y, excepto a bajas frecuencias,
resultaba bien diferente a la ley de Rayleigh-Jeans. Esto implicaba que algo estaba equivocado en
(a) la mecanica estadstica o (b) el electromagnetismo clasico. En 1900 Planck asumio que la falla
estaba en el electromagnetismo, dando comienzo a la mecanica cuantica.
La cuantificacion del Hamiltoniano (8.83) da como resultado un Hamiltoniano de la forma
H=

h(~k)n~k,j

(8.92)

~k,j

donde j = 1, 2 corresponde a las dos polarizaciones y n~k,j = 0, 1, . . .. La funcion de particion


canonica puede entonces escribirse como
Z=

Z~k,j

(8.93)

~k,j

(notemos que el n
umero de osciladores en este caso es infinito, a
un en el caso de un vol
umen finito)
donde
Z~k,j =

eh(k)n =

n=0

(8.94)

1 eh(~k)

As
ln Z =

ln Z~k,j = 2

~k,j

ln 1 eh(k)

(8.95)

~k,j

y la energa interna resulta


U =

X
k

ln Z = 2
hc

h
ck

e
1
~
k

(8.96)

120
En el lmite termodinamico, reemplazando
X

~k

V
(2)3

d3 k

obtenemos:
V
hc
U (T, V ) = 2

k3

eh(~k) 1

dk

(8.97)

De la Ec.(8.97) tenemos
Z

3
U
8h
= 3
d
V
c
eh 1
0
de donde obtenemos la ley de radiaci
on de Planck:
8h
3
c3 eh 1
En el lmite de bajas frecuencias 0 la Ec.(8.99) reproduce la ley de Rayleigh-Jeans
u(, T ) =

(8.98)

(8.99)

8
kB T 2 ,
(8.100)
c3
sin embargo, la integral (8.98) es finita. De hecho, haciendo el cambio de variable x = h obtenemos
la ley de Stefan-Boltzmann:
u()

8
U
=
(kB T )4
3
V
(hc)

Z
0

x3
dx = T 4
ex 1

(8.101)

El calor especfico a vol


umen constante es por lo tanto
cv = 4T 3

(8.102)

que se anula para T 0 de acuerdo con la tercera ley de la termodinamica.

8.2.3.

El gas de fotones

Los resultados anteriores pueden ser derivados a partir de una interpretaci


on bastante mas
interesante. En 1928 P. Dirac suirio que el campo electromagnetico poda ser cuantizado tratando las
variables canonicas clasicas Q~k,j y P~k,j como operadores que obedecen las relaciones de conmutaci
on
h

Q~k,j , P~k0 ,j 0 = i
h~k,~k0 j,j 0
h

Q~k,j , Q~k0 ,j 0 = P~k,j , P~k0 ,j 0 = 0


Dirac tambien introdujo los operadores
a~k,j =

(~k)
i
Q~k,j +
P~
2h
(~k) k,j

(8.103)

a~ =

i
(~k)
Q~k,j
P~
2h
(~k) k,j

(8.104)

y sus hermitianos conjugados

k,j

los cuales satisfacen las relaciones de conmutaci


on

121
h

a~k,j , a~ 0

= ~k,~k0 j,j 0

k ,j 0

a~ , a~ 0

= a~k,j , a~k0 ,j 0 = 0

k ,j 0

k,j

(8.105)
(8.106)

Reemplazando entonces en el Hamiltoniano (8.83) se obtiene el Hamiltoniano cuantizado:


H=

h(~k) a~ a~k,j +

k,j

~k,j

1
2

(8.107)

el cual incluye el termino de punto cero (irrelevante para la Mecanica Estadstica, ya que solo representa una constante aditiva en la energa). Es posible ver a partir de las relaciones de
conmutacion (8.105)-(8.106) que los operadorres a~ a~k,j (hermitianos) tienen autovalores enteros
k,j

n~k,j = 0, 1, 2, . . . (comparar con Eq.(8.92)). Mas a


un, un analisis detallado muestra que los autoestados simultaneos del conjunto anterior de operadores corresponde exactamente a los autoestados
P
simetrizados de N partculas independientes con energas de una partcula h
(~k) y N = ~k,j n~k,j .
Los n
umeros cuanticos n~k,j asociados a cada oscilador armonico pueden por lo tanto interpretarse
como n
umeros de ocupacion correspondientes a los estados de una partcula con energa h
(~k).
As, el campo electromagnetico puede interpretarse como compuesto por cierto tipo de partculas, a las cuales se denomina fotones, las cuales obedecen la estadstica de Bose-Einstein. Estas
partculas tienen momento lineal p~ = h~k y se mueven a la velocidad de la luz c, lo cual requiere
que tengan masa
on
p en reposo nula. De esta manera, la energa resulta consistente con la expresi
relativista = c2 p2 + m2 c4 = cp. Los fotones son partculas de spin 1 (a pesar de que por la
condicion de transversalidad solo pueden asumir dos valores, correspondientes a las diferentes polarizaciones). Otra caracterstica que surge de la teora es que el n
umero de fotones no se conserva,
ya que los mismos pueden ser emitidos o absorvidos por atomos. Asi, el n
umero de fotones no esta
definido, ni siquiera en valor medio, lo cual implica que el potencial qumico sea = 0. De esta
manera, la funcion gran particion viene dada por la Ec.(8.2) tomando = 0:
X

(T, V ) = 2kB T

ln 1 eh(k)

(8.108)

~k

El n
umero medio de fotones con momento h
~k, independientemente de la polarizacion, es
D

n~k =

2
eh(~k)

(8.109)

donde el factor 2 proviene de las dos posibles polarizaciones. La energa interna puede obtenerse
directamente de
U (T, V ) =

h(~k) n~k

(8.110)

~k

Reemplazando la Ec.(8.109) en la ecuacion anterior reobtenemos la expresion (8.96). Tambien


podemos calcular la presion de radiacion en la cavidad a partir de
P =

kB T
= 2
V

Z
0

k 2 ln 1 ehck dk

(8.111)

Integrando por partes la Ec.(8.111) y comparando con la Ec.(8.97) obtenemos la ecuacion de estado
P =

U
3V

(8.112)

122
Notemos que en las funciones termodinamicas no aparece ninguna singularidad, esto es, el gas
de fotones no presenta condensacion de Bose. Fsicamente esto se debe a que el n
umero de fotones
no se conserva, lo cual hace que los fotones desaparezcan en lugar de condensar.

8.3.

Calor especfico de los s


olidos revisado: el gas de fonones

Si comparamos el Hamiltoniano (8.83) para el campo electromagnetico en una cavidad con el


Hamiltoniano (6.119) para las oscilaciones de un cristal, vemos que la situacion es enteramente
analoga. En este u
ltimo caso, la cuantificaci
on del campo de vibraciones del cristal resulta equivalente a un gas de bosones llamados fonones. As, el calor especfico de los solidos pueder ser
derivado en el ensemble gran canonico, considerando un gas de bosones con potencial qumico cero
(el n
umero de fonones tampoco se conserva) y las relaciones de dispersion apropiadas (ver captulo
6). Fonones y fotones son llamados cuasi partculas.

Captulo 9

Gas ideal de Fermi-Dirac


Los fermiones son partculas de spin semi-entero. Supongamos el caso mas simple de spin 1/2,
esto es, partculas para las cuales Sz =
h/2, estados que vamos a denotar por =, . Denotemos
por l a cada estado asociado a los n
umeros cuanticos l = (~k, ). En ausencia de campos electromagneticos, la energa no depende de . Asi, cada estado ~k podra alojar hasta dos partculas con
spines opuestos, sin violar el principio de exclusion. De esta manera, la funcion gran particion (7.34)
para el gas ideal de Fermi-Dirac puede escribirse como

1
1
2
X
Y
Y X
n~k, (~k )
n~k, (~k )
ZF D (T, V, ) =
e
e
1 + e(~k )

=
~k

n~k, =0

n~k, =0

(9.1)

~k

Para un gas de fermiones de spin s generico, la potencia 2 de la expresion anterior se reemplaza


por la degeneracion g = 2s + 1. Asi
ZF D (T, V, ) =

1 + e(~k )

(9.2)

~k

El potencial gran canonico resulta entonces


F D (T, V, ) = kB T ln ZF D (T, V, ) = kB T g

ln 1 + e(~k )

(9.3)

~k

de donde podemos calcular

F D
hN i =

T,V

~k

ge(~k )
1 + e(~k )

X
~k

g
e(~k ) + 1

XD

n~k

(9.4)

~k

de donde
D

n~k =

g
e(~k ) + 1

gz
~k
+z
e

(9.5)

Para el gas ideal de Fermi-Dirac el n


umero medio de partculas nunca es divergente. El potencial
qumico puede tomar cualquier valor < < y por lo tanto 0 z < . Calculemos
las funciones termodinamicas. Reemplazando las sumas por integrales en el lmite termodinamico
tenemos
P =

4kB T g
F D
=
V
(2)3

Z
0

2 2
k /2m

k 2 ln (1 + zeh

123

)dk

(9.6)

124

f3/2(z)

~(Ln z)3/2

~z
0
0

Figura 9.1: Funcion f3/2 (z).


Z

4V g
hN i =
(2)3

2 2
k /2m

eh

+z

dk

(9.7)

Haciendo el cambio de variable usual x = hk /2m tenemos que


P =

F D
kB T g
=
f (z)
V
3T 5/2

(9.8)

gV
f (z)
3T 3/2

(9.9)

hN i =

donde
4
f5/2 (z) =

4
f3/2 (z) =

Z
0

Z
0

zk
k 5/2

(9.10)

k
X
z
k+1 z
(1)
dx
=
2
k 3/2
ex + z
k=1

(9.11)

x2 ln [1 + zex ] =

(1)k+1

k=1

La funcion f3/2 se muestra en la Fig.9.1.


Las ecuaciones de estado del gas de Fermi-Dirac se determinan eliminando z en funcion de y
T de la ecuacion:
3T = gf3/2 (z)

(9.12)

Los distintos comportamientos de interes ocurren para valores de z 1 y z 1. Para valores


peque
nos de z tenemos del desarrollo en serie (9.11)
f3/2 (z) = z

z2
+
23/2

(9.13)

125
Para valores grandes de z podemos obtener un desarrollo asint
otico de la siguiente manera. Llamemos
= ln z.
Entonces, usando el cambio de variable y = x2 ,
4
f3/2 (z) =

Z
0

ex2

2
dx =

+1

1
ey

4
dy =
+1
3

Z
0

y 3/2 ey
dy
(ey + 1)2
(9.14)

donde en el u
ltimo paso hemos integrado por partes. La funcion
ey
+ 1)2

(ey

tiene un pico simetrico en y = y decae rapidamente para valores de y 6= . Asi, podemos desarrollar
y 3/2 en serie de Taylor alrededor de y = :

4
3
3
ey

3/2 + 1/2 (y ) + 1/2 (y )2 +


dy y
3 0
(e
+ 1)2
2
8

Z
t
3 1/2
4
3 1/2 2
e
3/2

t
+

t
+

dt t
3 (e + 1)2
2
8

f3/2 (z) =
=

(9.15)
(9.16)

Escribimos entonces
Z

La segunda integral es de orden e . Asi

f3/2 (z) =
=

4
3
3
et

3/2 + 1/2 t + 1/2 t2 + + O e


dt t
2
3 (e + 1)
2
8

4
3
3
3/2
1/2
1/2

I0 + I1 + I2
+ + O e
3
2
8

(9.17)
(9.18)

donde
In

dt

tn et
(et + 1)2

(9.19)

El termino
et
(et + 1)2
es una funcion par de t. Asi, para n impar tenemos que In = 0. Para n = 0 tenemos
I0 = 2
Para n > 0 par tenemos

Z
0

dt

d
1
= 1.
t
dt (e + 1)

(9.20)

126

"

In

= 2

= 2n

Z
0

Z
0

du

tn1
dt t
(e + 1)

=1

n
= 2

Z
=1 0

du

un1
(eu + 1)

un1
= (n 1)!(2n)(1 21n )(n)
(eu + 1)

(9.21)
(9.22)

donde (n) es la funcion zeta de Riemann ( (2) = 2 /6, (4) = 4 /90, (6) = 6 /945). Por lo
tanto
"

f3/2 (z) =
=

9.0.1.

2
4
(ln z)3/2 + (ln z)1/2 + + O z 1
3
8

"

kB T

3/2

2
+
8

kB T

1/2

+ + O e

(9.23)

(9.24)

Bajas temperaturas/Altas densidades (3T /v 1)

Este es el regimen en el cual los efectos cuanticos, en particular el principio de exclusion de


Pauli, se vuelven relevantes. A bajas temperaturas tendremos que
3T
4
=
g
3

"

3/2

kB T

2
+
8

kB T

1/2 #

"

+O

5/2 #

(9.25)

y recordemos que

2
h2
mkB T

!1/2

Vemos que cuando T 0 el potencial qumico tiende a un valor constante = F , que define la
energa de Fermi:

2
h
F
2m

!2/3

6 2

(9.26)
D

Para entender el significado fsico de F examinemos el comportamiento del n


umero medio n~k
~
de partculas con momento p~ = hk en las cercanas del cero absoluto:
D

n~k

g
e

(~k F )

+1

(9.27)

En el lmite T 0 ( ) la exponencial en el denominador diverge para todo valor ~k > F y


se anula para todo valor ~k < F . Asi, tenemos que
D

n~k

T =0

g (~k < F )
0 (~k > F )

(9.28)

El significado fsico de esta expresion es claro. El principio de exclusion de Pauli no permite mas
de g partculas en cada autoestado de p. En el estado fundamental del gas las partculas ocupan los
estados de menor energa posible, y por lo tanto van llenando los niveles inferiores hasta alcanzar un
valor finito F . Asi F es simplemente el menor autovalor de energa de una partcula por debajo
del cual hay hN iT =0 /g niveles
ocupados. En el espacio de los momentos las partculas ocupan
una esfera de radio pF = 2mF , llamado momento de Fermi, cuya superficie se denomina

127

Figura 9.2: Valor medio de los n


umeros de ocupacion en el gas ideal de Fermi, para una direccicon
~k particular en el espacio recproco.
superficie de Fermi. Con esta interpretaci
on podemos calcular directamente la energa de Fermi,
sin tomar ning
un lmite. Cada estado en el espacio de momentos ocupa un vol
umen (2
h)3 /V . Asi
una esfera de radio pF contendra
hN i
V 4 3
p =
(2
h)3 3 F
g
D

estados, de donde recuperamos la expresion (9.26). A temperaturas suficientemente bajas n~k tiene

el comportamiento que se muestra en la Fig.9.2. Unicamente


una peque
na fraccion de las partculas
con energas del orden de kB T por debajo de F son excitadas por encima de F , mientras que las
restantes permanecen con sus energas fijas. Por lo tanto u
nicamente las partculas con energas en
torno de F podran alterar su estado ante una perturbacion externa, como por ejemplo un campo
electrico.

Para obtener las funciones termodinamicas del gas a bajas temperaturas tenemos que considerar
el siguiente termino en el desarrollo (9.25), el cual puede escribirse como
"
3/2
F

3/2

"
3/2

"
3/2

2
1+
8

2
1+
8

2
1+
8

1
1+

2
8

kB T
F

kB T

kB T
F
kB T
F

2 2/3

+
2
2 #

+
"

+O

2
=1
12

kB T
F

kB T
F

4 #

(9.29)

(9.30)

128
"

= = F 1

12

kB T
F

(9.31)

El parametro de la expansion es kB T /F . Si definimos la temperatura de Fermi como


kB TF F

(9.32)

entonces bajas temperaturas y altas densidades significa que T TF 1 . En este dominio se dice que
el gas se encuentra degenerado, dado que todas las partculas tienden a estar en el estado de menor
energa posible.
La energa interna viene dada por
U=

XD

n~k ~k =

~k

h2
V 2
(2)3 m

Z
0

k 4 n~k dk

(9.33)

Integrando por partes


V h2
U= 2
4 m

Z 5
k

Z
D E
V g
h4 6
e~k

n~k dk =
k

2 dk
k
20 2 m2 0
e~k + 1

(9.34)

Usando el cambio de variable y = h2 k 2 /2m obtenemos


U=

Vg
(2mkB T )5/2
20 2 h3 m

Z
0

y 5/2

ey
dy
(ey + 1)2

(9.35)

Siguiendo el mismo procedimiento que usamos para obtener el desarrollo de f3/2 , desarrollamos
y 5/2 en serie de Taylor alrededor de y = :

Vg
et
5
15
5/2
5/2
(2mk
T
)
dt
+ 3/2 t + 1/2 t2 +
B
3
2
2
t
2
8
20 h m
(e + 1)

Vg
5
(2mkB T )5/2 5/2 + 2 1/2 +
8
20 2 h3 m

=
=

(9.36)
(9.37)

Reemplazando la expresion (9.31) para y conservando terminos hasta orden cuadratico en kB T /F


tenemos

2
Vg
5/2
(2m
)
1

F
12
20 2 h3 m

3
5
kB T
hN i F 1 + 2
5
12
F

"

kB T
F

2 !5/2

5
kB T
+ 2
8
F

(9.38)

(9.39)

De esta u
ltima expresion podemos calcular la forma asint
otica del calor especfico a bajas temperaturas:
1
Cv =
V

U
T

=
V,hN i

2T
2 kB
+
2 F

(9.40)

Vemos que el calor especfico tiende a cero linealmente cuando T 0 y por lo tanto satisface la
tercera ley de la termodinamica.
1

De la Ec.(9.26) es facil ver que (T /TF )3/2 3T /v, donde el coeficiente de proporcionalidad es de orden uno para
cualquier valor razonable de g.

129
Finalmente, integrando por partes dos veces la Ec.(9.10) obtenemos para f5/2 (z) la expresion:
f5/2 (z) =

8
15

Z
0

y 5/2

ey
dy
(ey + 1)2

(9.41)

de donde usando el mismo procedimiento que anteriormente llegamos a la expresion


"

2
5
kB T
P = F 1 + 2
5
12
F

+ =

2U
3V

(9.42)

Esto nos muestra que a


un a T = 0 se necesitan paredes externas para contener un gas ideal de
Fermi, ya que la presion no se anula (a diferencia del gas ideal clasico y el gas de Bose). Esta es
una manifestacion del principio de exclusion de Pauli, que solo permite un n
umero g de partculas
con momento cero. Todas las restantes partculas tienen momento finito y dan lugar a la presion
del punto cero.

9.0.2.

Altas temperaturas/Bajas densidades (3T /v 1)

Usando el desarrollo (9.13) en la Ec.(9.12) tenemos


3T
z2
= z 3/2 +
gv
2

(9.43)

Esta ecuacion puede invertirse desarrollando z en una serie de potencias en 3T /v; reemplazando en
la ecuacion anterior y comparando iguales potencias se obtiene que:
3
1
z = T + 3/2
gv
2

3T
gv

!2

(9.44)

Para partculas sin spin g = 1, el primer termino de esta ecuacion nos da la ecuacion de estado
correspondiente para el gas de Maxwell-Boltzmann (7.45).
Tenemos ademas de la Ec.(9.8)
P
g
= 3
kB T
T

z2
gz
z 5/2 + = 3
T
2

z
25/2

(9.45)

y usando la Ec.(9.44) tenemos


Pv
1 3
= 1 + 5/2 T +
kB T
gv
2

(9.46)

Esto es, tenemos la ecuacion de estado del gas ideal mas correcciones. Vemos asi que el gas de
Fermi-Dirac se comporta tambien como el gas de Maxwell-Boltzmann a altas temperaturas y bajas
densidades, tal como fue anticipado.

9.0.3.

Ejemplo: calor especfico electr


onico de los metales

En un solido metalico puede considerarse en una primera aproximaci


on que los electrones de
valencia se desacoplan de los iones, los cuales se localizan formando la estructura cristalina. Dichos
electrones (llamados electrones de conduccion) se comportan entonces como un gas de fermiones
cargados negativamente, los cuales se mueven en un potencial periodico creado por los iones. Si
bien podramos esperar que la interaccion coulombiana entre electrones juege un papel importante,
el efecto de la carga positiva de los iones sumado al caracter de largo alcance de la interacci
on
coulombiana apantalla de manera efectiva el potencial que ve cada electron; as, en una primera
aproximacion podemos considerar los electrones como partculas independientes que se mueven en

130
un potencial periodico generado por los iones. En un segundo nivel de aproximaci
on, podemos
despreciar el potencial perodico, con los cual nos resta un gas ideal de fermiones en ausencia de
potencial externo. Si bien esta u
ltima aproximaci
on, conocida como Teora de Sommerfeld, es inadecuada para describir las propiedades de conduccion electrica en metales, resulta una aproximaci
on
sorprendentemente buena para describir las propiedades termicas en equilibrio de gran cantidad de
metales. La aplicacion entonces de los resultados de las secciones anteriores resulta inmediata.
Analicemos primero bajo que condicion debemos analizar el problema. Supongamos el caso mas
simple de un electron de conduccion por atomo. El vol
umen especfico resulta entonces v = a3 ,
donde a es el parametro de red, el cual toma un valor tpico a 5
A. Dado que la masa del electron
28
27
es m 9 10
g y recordando que h
10
erg.seg, a temperatura ambiente T 300 K
un
esto nos da una longitud de onda termica T 4 107 cm. As, 3T /v 1000, con lo cual a
a temperaturas relativamente altas el gas de electrones se encuentra fuertemente degenerado. En
particular, esto implica que la contribuci
on de los electrones (9.40) al calor especfico es en general
mucho menor al valor clasico 3/2 kB (T TF ). Dado que la temperatura de Debye para la
mayora de los metales esta entre 100 y 400 K, el calor especfico de los mismos a temperatura
ambiente esta principalmente determinado por las vibraciones de los iones del cristal.
A temperaturas suficientemente bajas, no obstante, la contribuci
on electronica lineal en la tem3
peratura puede ser importante comparada con el termino T del modelo de Debye. As
Cv A T + B T 3
Experimentalmente suele representarse C/T = A + B T 2 vs. T 2 , encontr
andose que los datos
presentan un acuerdo excelente con una lnea recta.

Captulo 10

Mec
anica Estadstica y
Termodin
amica de sistemas
magn
eticos
Consideremos un sistema de N partculas con momento magnetico, cuya componente en la
~ viene dada por i , i = 1, . . . , N . El Hamiltoniano del
direccion de un campo magnetico externo B
sistema viene dado entonces por
H = H0 B

N
X

(10.1)

i=1

~ y H0 es el Hamiltoniano del sistema en ausencia de campo externo, el cual incluye


donde B = |B|
la energa cinetica e interacciones entre partculas. Vamos a analizar la mecanica estadstica de este
sistema en el ensamble canonico. Tenemos que
"

N
X
1
1
= eH = exp H0 B
i
Z
Z
i=1

!#

(10.2)

con
"

Z = Tr e

= Tr exp H0 B

N
X

!#

(10.3)

i=1

Sea
M

*N
X

i=1

1
= Tr
Z

" N
X

i e

#
H

(10.4)

i=1

la magnetizacion total del sistema. La entropa del sistema viene dada por
S = kB Tr ln

(10.5)

reemplazando la expresion (10.2) tenemos que


S=

1
hHi + kB ln Z
T

(10.6)

de donde podemos definir la funcion


F (T, B, V, N ) kB T ln Z(T, B, V, N ) = hHi T S
133

(10.7)

134
Para un sistema de partculas no magneticas la funcion (10.7) corresponde a la energa libre
de Helmholtz, esto es, a la transformada de Legendre de la energa con respecto a la entropa. A
que potencial termodinamico (energa libre) corresponde F en el caso magnetico? Supongamos por
simplicidad un solido magnetico (el caso mas frecuente), en cuyo caso las variables termodinamicas
relevantes son T , B y N (el vol
umen es proporcional al n
umero de partculas). Esto es, F =
F (T, B, N ), con lo cual F resulta el analogo a la energa libre de Gibbs en un fluido, esto es,
la transfornada de Legendre de la energa interna respecto de la entropa y la variable extensiva
magnetica relevante, la magnetizacion. No obstante, si definimos la energa interna como U = hHi,
resulta que F = U T S. Esta forma indicara que F es la transformada de Legendre de la energa
respecto solo de la entropa, es decir, al analogo del potencial de Helmholtz en un fluido. Una
formulacion consistente con el formalismo termodinamico puede obtenerse definiendo
U hH0 i

(10.8)

F (T, B, N ) = U T S BM

(10.9)

Con esta definicion tenemos que

que tiene la forma de una transformada de Legendre de U con respecto a S y M . Veamos si esto
es consistente. Sabemos que

S=

F
T

(10.10)
B,N

ya que esta ecuacion es la misma que para el caso de una gas. Si nuestra interpretaci
on es correcta
debe cumplirse tambien que

M =

F
B

(10.11)
T,N

De la Ec.(10.7) tenemos que

F
B

T,V,N

= kB T
=
=

1
Tr
Z
*N
X

ln Z
B

(N
X

(10.12)
T,V,N

i e

H0 B

PN

i=1 i

(10.13)

i=1

(10.14)

i=1

de donde (10.11) es correcta. De hecho, si consideramos un sistema descripto por el Hamiltoniano H0


en contacto con un reservorio de temperatura y de campo magnetico (esto es, a
nadimos el vnculo
de magnetizacion media constante), la aplicacion del principio variacional de Gibbs nos lleva a la
expresion (10.3) para la funcion particion, donde el multiplicador de Lagrange asociado al nuevo
vnculo resulta proporcional a B. Esto significa que de hecho estamos trabajando en un ensamble
diferente del canonico. Sin embargo, resulta habitual considerar que el Hamiltoniano del sistema
es (10.1) y trabajarlo en el ensamble canonico. Los resultados son totalmente independientes de
la intrerpretacion. En lo que sigue adoptaremos este u
ltimo punto de vista, pero conviene tener
conocimiento de esta diferencia sutil, ya que en circunstancias muy particulares puede llevar a
errores.
En el caso de trabajar en el ensamble gran canonico la energa libre que se obtiene resulta la
transformada de Legendre de la energa interna con respecto a S, M y hN i.
Finalmente la susceptibilidad magnetica a campo nulo se define como

135

1
0
V

M
B

T,V,N

(10.15)
B=0

Asi, para campos debiles tenemos que


M/V 0 B.
De las Ecs.(10.3) y (10.4) tenemos que

M
B

T,V,N

= 2 Tr
Z
=

" N
X

* N
X

i eH

i=1

!2 +

i=1

2
Z

Tr

!2 +
N
X
=
i
M 2

N
X
Z

+ Tr
i
B Z
i=1

" N
X

i e

!2

eH

(10.16)

#!2
H

(10.17)

i=1

(10.18)

i=1

As
0 =

1
kB T V

!2 +
N
X

i
M 2
i=1

(10.19)

B=0

Este resultado es un caso particular de lo que se conoce como Teorema de Fluctuaci


on-Disipaci
on,
el cual establece que la respuesta de una cantidad macroscopica a una perturbacion externa peque
na
(esto es, 0 como respuesta al campo externo B) es proporcional a las fluctuaciones de dicha cantidad en equilibrio en ausencia de la perturbacion. Este resultado es analogo a la relacion (6.44)
entre el calor especfico y las fluctuaciones de energa. La expresion anterior, por otra parte, es de
gran utilidad en el calculo de 0 mediante simulaciones numericas.

Captulo 11

Magnetismo en medios materiales


Las propiedades magneticas de la materia macroscopica estan determinadas casi exclusivamente por los momentos magneticos de los electrones de los atomos constituyentes. Los momentos
magneticos nucleares son del orden de mil veces mas debiles que los de los electrones y por lo
tanto pueden despreciarse. Asi, los diferentes comportamientos magneticos que se observan en la
materia estan estrechamente relacionados con la estadstica de Fermi y por lo tanto con el principio de exclusion de Pauli. En muchos materiales estos momentos magneticos presentan una fuerte
interaccion entre ellos. Esto da orgen a diferentes tipos de propiedades magneticas, siendo la mas
comunes el ferromagnetismo y el antiferromagnetismo.
Por otra parte, a
un en el caso de spines debilmente interactuantes, en presencia de campos
magneticos externos los electrones presentan dos efectos diferentes: (a) movimiento en orbitas
cuantizadas normales al campo magnetico, las cuales generan acoplamientos entre los momentos
angulares orbitales y el campo; (b) los spines electronicos tienden a alinearse con el campo externo.
El primer efecto da lugar al diamagnetismo (esto es, sistemas para los cuales < 0) mientras que
el segundo da lugar al paramagnetismo. Vamos a estudiar estos efectos por separado, comenzando
con el diamagnetismo y fenomenos relacionados.

11.1.

Diamagnetismo de Landau

El fenomeno de diamagnetismo esta relacionado con la interacci


on entre el campo externo y
el momento magnetico asociado con el momento angular orbital de los electrones. Clasicamente,
podramos pensar que el campo magnetico externo induce corrientes circulares, las cuales en virtud
de la ley de Lenz generan momentos magneticos opuestos al campo. Sin embargo, veremos que esto
es falso. El fenomeno es netamente cuantico. Podemos ver esto a traves de un modelo ultrasimplificado, en el cual vamos a ignorar el spin de los electrones asi como tambien la interacci
on entre
ellos; esto dara un modelo ideal de diamagnetismo en metales. El Hamiltoniano de una partcula
~ esta dado por la expresion:
de carga e y masa m en presencia de un campo magnetico B

e~
1
p~ + A
H=
2m
c

(11.1)

~ es el potencial vector asociado con el campo y c es la velocidad de la luz.


donde A
En el contexto de la mecanica clasica la presencia del campo externo en este caso no tiene
ninguna influencia sobre las propiedades termodinamicas. Podemos ver facilmente esto si escribimos
la funcion particion para una partcula en el espacio de las fases clasico:
Z

Z1 =

Z
3

d r

"

2 #

e~

p~ + A
d p exp
2m
c
3

137

(11.2)

138
~ es canonica y por lo tanto tiene determinante uno. Asi la funLa transformacion p~ p~ (e/c) A
cion de particion es equivalente a la del gas ideal clasico y por lo tanto no hay diamagnetismo.
Fsicamente, esto se debe a que la fuerza de Lorentz producida por el campo externo es siempre
centrpeta y por lo tanto no produce trabajo mecanico. As, la energa de un electron es independiente de la presencia del campo. Dado que estamos sumando sobre todos los posibles valores de los
momentos, estamos considerando corrientes circulares en ambos sentidos de rotacion alrededor del
campo magnetico con igual peso estadstico y por lo tanto los efectos se cancelan.
El diamagnetismo es un fenomeno puramente cuantico. Necesitamos entonces encontrar las
soluciones de la Ec. de Schrodinger independiente del tiempo correspondiente al Hamiltoniano
(11.1).
~ en la direccion del eje z. La
Vamos a considerar un campo magnetico externo uniforme B
invariancia de gauge nos da libertad de elegir de distintas maneras el potencial vector. Vamos a
elegir:
Ax = By

Ay = Az = 0

(11.3)

El Hamiltoniano (11.1) toma entonces la forma


o
1 n
[px (eB/c) y]2 + p2y + p2z
(11.4)
2m
Podemos resolver la ecuacion de Schrodinger proponiendo para la funcion de onda la siguiente
forma:

H=

(x, y, z) = ei(kx x+kz z) f (y)

(11.5)

Tenemos que
o
1 n
[
hkx (eB/c) y]2 + p2y + h2 kz2 ei(kx x+kz z) f (y).
2m
Asi, la ecuacion de Schrodinger H = nos queda

Hei(kx x+kz z) f (y) =

(11.6)

1 2 1
p + m02 (y y0 )2 f (y) = 0 f (y)
2m y 2

(11.7)

donde 0 = h2 kz2 /2m, 0 = eB/mc e y0 = (


hc/eB)kx . Vemos que f (y) satisface la ecuacion
de un oscilador armonico cuya frecuencia 0 es igual a la frecuencia de Larmor clasica, esto es,
la frecuencia de rotacion de una partcula clasica cargada en un campo magnetico uniforme. Los
autovalores de energa son entonces

1
2 kz2
h
(kz , n) =
+ h0 n +
(11.8)
2m
2
donde n = 0, 1, . . .. Estos autovalores se conocen como niveles de Landau. Si consideramos que
el gas esta contenido en una caja c
ubica de lado L con condiciones de contorno periodicas entonces
kx,z = 2nx,z /L, nx,z = 0, 1, 2, . . .. Notemos que los niveles de Landau no dependen de kx y por
lo tanto tendran una degeneracion igual al n
umero de autovalores permitidos de kx . Dado que y0
depende de kx los autovalores permitidos de kx ser
an aquellos tales que 0 < y0 < L, esto es
0 < nx <

eB 2
L
hc

Asi, g = (eB/hc)L2 es la degeneracion de los niveles de Landau. La dependencia de la degeneracion


en L2 nos dice que esta es sumamente alta, a
un para campos debiles. De esta manera podemos
construir nuevas autofunciones para cada nivel de Landau combinando las soluciones obtenidas
para un mismo nivel. En particular, pueden construirse soluciones que son a la vez autoestados de

139
la componente del momento angular orbital en la direccion del campo. Esto puede verse eligiendo
el siguiente gauge en lugar de (11.3):

~ = 1 (~r B)
~ =1
A
x B
2
2
0

(11.9)

~ = 0 (gauge de Coulomb). Es simple ver (queda como ejercicio para el lector)


el cual satisface .A
que usando el gauge (11.9) el Hamiltoniano (11.1) adopta la forma
2
p2
z + m 0 (x2 + y 2 )
+ 0 L
(11.10)
2m
2
z es la componente z del operador momento angular L
~ = ~r p. Este Hamiltoniano resuldonde L
ta la suma de tres contribuciones: una componente de energa cinetica en la direccion z: p2z /2m,
z y un oscilador armonico bidimensionl de frecuencia 0 . Dado que
un acoplamiento Zeeman 0 L
este u
ltimo tiene simetra azimutal alrededor del eje z, las autofunciones pueden ser elegidas pro z . De esta menra, los niveles de Landau pueden
porcionales a las autofunciones del operador L
interpretarse como resultado de la cuantizaci
on de las orbitas clasicas circulares en el plano perpendicular al campo magnetico.
Podemos entonces escribir la funcion gran particion utilizando el espectro (11.8) como

H=

Z=

1 + zel

(11.11)

donde l denota ahora el conjunto de n


umeros cuanticos l = (kz , n, nx ). Dado que la energa l no
depende de nx tenemos que
Z=

1 + ze(kz ,n)

(11.12)

kz ,n

ln Z = g

ln 1 + ze(kz ,n)

(11.13)

n=0 kz =

En el lmite termodinamico L

gL X
ln Z =
n=0

Z
0

ln 1 + ze(kz ,n) dkz

(11.14)

donde

(kz , n) =

2 kz2
h
1
+ h0 n +
2m
2

y el potencial gran canonico resulta


Z

gLkB T X
=
ln 1 + ze(k,n) dk

n=0 0

(11.15)

donde hemos eliminado el subndice z de k por simplicidad. Para el n


umero de partculas tenemos

hN i =

=
T,B,V

gL X
n=0

z 1 e(k,n)

dk

+1

(11.16)

140

11.1.1.

Lmite de altas temperaturas: diamagnetismo

Para T ( 0) tenemos que z 0, ya que hN i tiene que mantenerse finito. Desarrollando


entonces la Ec.(11.15) en potencias de z tenemos que

(T, B, V ) =

2 2
gLkB T z X
eh0 (n+1/2)
eh k /2m dk

0
n=0

gLkB T z h0 /2 X
=
e
eh0 n
T
n=0

(11.17)

donde T es la longitud de onda termica. As


(T, B, V ) =

gLkB T z eh0 /2
V kB T z eB
1
=
T
1 eh0
2T hc senh (0 B)

(11.18)

donde
0

e
h
2mc

es el magneton de Bohr. El n
umero medio de partculas resulta entonces
hN i =

V z eB
1
2T hc senh (0 B)

(11.19)

La magnetizacion resulta

B T,V,

1
cosh (0 B)
V kB T z e
B0
=
2T hc senh (0 B)
senh2 (0 B)

hN i
B0
= kB T
1
B
tanh (0 B)
= 0 hN i L (0 B)
=

(11.20)

donde
L(x) cotgh(x)

1
x

se conoce como funcion de Langevin y se muestra en la Fig.11.1. Del desarrollo asint


otico
cotgh(x) =

1 x x3
+
+
x 3 45

vemos que L(x) x/3 para x 1. Asi, a altas temperaturas y campos debiles tenemos que
M =

hN i 20 B
3kB T

(11.21)

20
3kB T

(11.22)

de donde finalmente la susceptibilidad resulta


0 =

141

Figura 11.1: Funci


on de Langevin.

esto es, la magnetizacion resulta opuesta al campo externo. Notemos que el diamagnetismo, a
un
siendo un efecto de origen cuantico, se manifiesta a altas temperaturas.
Finalmente, debemos notar que la susceptibilidad magnetica es la derivada segunda de una
energa libre respecto de un parametro intensivo. El criterio de estabilidad termodinamica implica
que la misma debe ser estrictamente positiva. El diamgnetismo parece por lo tanto violar la estabilidad termodinamica. Fsicamente, esto se relaciona con el hecho de que el trabajo realizado por la
fuente de campo externo sobre el sistema es BdM . As, una susceptibilidad negativa significa que
al aumentar el campo externo el sistema entrega energa a la fuente, lo cual es claramente inestable,
ya que podemos utilizar esa energa para incrementar a
un mas el campo. Sin embargo, debemos
recordar que BdM representa el trabajo adicional realizado por la fuente para establecer el campo
dentro de la muestra, respecto del trabajo necesario para establecer el campo en el vaco. As, en
presencia de la muestra la fuente externa debe realizar menos trabajo que en ausencia de la misma,
pero el trabajo neto es positivo. Si se incorpora esta contribuci
on a la definicion termodinamica de
energa del sistema, no existe ninguna violacion a la estabilidad termodinamica.

11.1.2.

Lmite de bajas temperaturas: efecto De Haas - Van Alphen

A bajas temperaturas no hay hay diamagnetismo, pero aparece otro fenomeno asociado con los
niveles de Landau: en ciertos solidos la magnetizacion presenta un comportamiento oscilatorio al
variar el campo externo. Este fenomeno fue medido por primera vez en 1931 por W. J. De Haas y P.
M. Van Alphen. La descripcion correcta del efecto involucra la resolucion de la Ec. de Schr
odinger
para una partcula en un potencial periodico en presencia de campo magnetico externo, lo que
constituye un problema matematico sumamente complicado. Podemos, no obstante, tener una idea
cualitativa del fenomeno mediante un modelo simplificado de un gas bidimensional de electrones
no interactuantes, en presencia de campo, esto es, nuestro modelo anterior pero despreciando los
movimientos en la direccion z. Ademas, vamos a considerar el caso kB T
h0 , de manera que
podemos asumir T = 0. El problema se reduce entonces al calculo del estado fundamental.
La idea basica por detras del fenomeno es la siguiente: la degeneracion de los niveles de Landau
es independiente del nivel de energa y depende de la intensidad del campo externo. Para un
campo suficientemente grande todas las partculas se encontrar
an en el nivel de menor enera. Si
disminuimos el campo, a partir de cierto valor dicho nivel no podra alojar todas las partculas

142

Figura 11.2: Energa a T = 0 de un gas de electrones sin spin en funcion del campo magnetico
aplicado.
y algunas se veran forzadas a saltar a niveles de mayor energa. Esto producira cambios en las
propiedades magneticas del sistema.
Podemos escribir los niveles de Landau y su degeneracion de la siguiente manera

(n) = 20 B n +
g = N B/B0

1
2

B0 = hc/e

(11.23)
(11.24)

donde = N/L2 . El campo B0 es el valor de B por encima del cual un u


nico nivel puede alojar a
las N partculas.
Si B/B0 > 1 todas las partculas se encontrar
an en el menor nivel de Landau n = 0 y la energa
del estado fundamental sera
E0 = N 0 B

(11.25)

Si B/B0 < 1 entonces algunas de las partculas ocuparan niveles de mayor energa. Por ejemplo,
si 1/2 < B/B0 < 1, el nivel n = 0 estara lleno y el nivel n = 1 parcialmente ocupado. Para
B/B0 = 1/2 la degeneracion de un nivel sera igual a la mitad de partculas. Asi, para B/B0 < 1/2
los dos niveles inferiores estaran completos y el nivel con n = 2 estara parcialmente ocupado.

Supongamos que B es tal que todos los niveles hasta n = k se encuentran completos y el
n = k + 1 esta parcialmente ocupado. La condicion para B es
(k + 1)g < N < (k + 2)g

(11.26)

1
B
1
<
<
(k + 2)
B0
(k + 1)

(11.27)

Para B en este intervalo tenemos

143

/(2/B0)
14

12

M/(L 0)

10

1/3

1/4

1/2

B/B0

-1

0
1/4 1/3

1/2

B/B0

Figura 11.3: Efecto De Haas - Van Alphen.

E0 = g

k
X

(i) + [N (k + 1)g] (k + 1)

(11.28)

i=0

Reemplazando las Ecs.(11.23) y (11.24) tenemos, luego de cierta algebra,

B
E0
= 0 B 2k + 3 (k + 1)(k + 2)
N
B0

(11.29)

Introduciendo el parametro
x

B
B0

podemos resumir
E0 (B)
=
N

0 B0 x
x>1
1
0 B0 x [2k + 3 (k + 1)(k + 2)x] k+2
<x<

1
k+1 ,

k = 0, 1, . . .

(11.30)

Tenemos as dos efectos que se compensan: al aumentar el campo magnetico la energa de cada
nivel aumenta, pero por otro lado al aumentar la degeneracion los niveles de mayor energa se
despueblan. Esto da lugar a un comportamiento oscilatorio de la energa, como se ilustra en la
Fig.11.2. La magnetizacion por unidad de area y la susceptibilidad magneticas resultan entonces
M
L2

(E0 /N )
=
B
(

L,N

0
x>1
1
<x<
0 [2(k + 1)(k + 2)x (2k + 3)] k+2

1
k+1 ,

(11.31)

144

(M/L2 )
=
B
(

!
L,N

0
x>1
1
20 /B0 (k + 1)(k + 2) k+2
<x<

(11.32)

1
k+1

y se muestran en la Fig.11.3

11.2.

Paramagnetismo de Pauli

Consideremos ahora el efecto del acoplamiento directo entre los spines electronicos y el campo
externo, despreciando el acoplamiento del momento angular orbital, esto es, un sistema descripto
por el Hamiltoniano:
H=

N
X
1
i=1

2m

p2i

~ i
0 B.~

(11.33)

donde 0 es el magneton de Bohr y ~ son las matrices de Pauli. Para un u


nico electron con el
campo orientado en la direccion del eje z tenemos
1 2
p 0 Bz
2m
y por lo tanto el espectro de una partcula es
H1 =

(11.34)

1 2
p 0 Bs
2m
donde s = 1. El potencial gran canonico resulta entonces:
(~
p, s) =

= kB T

X X

ln 1 + ze(~p,s)

p
~ s=1

= kB T

X X
p
~

(11.35)

2
ln 1 + z exp
p + 0 Bs
2m
s=1

(11.36)

Para partculas en una caja de vol


umen V = L3 , p~ = h~k, donde ki = 2ni /L y ni = 0, 1, 2, . . ..
En el lmite termodinamico:

=
=

4kB T V
(2)3
kB T V
4 2

Z
0

2m
h2

k2

ln 1 + z exp

s=1

3/2 Z
0

1/2

2 2
h k + 0 Bs

2m

dk

ln 1 + ze+0 Bs d

(11.37)

s=1

donde hemos usado el cambio de variable = h2 k 2 /2m. Podemos entonces escribir


= + +

(11.38)

donde
kB T V
=
4 2

2m
h2

3/2 Z
0

1/2 ln 1 + ze0 B

oo

(11.39)

145
El n
umero medio de electrones esta dado por

hN i =

= hN+ i + hN i

(11.40)

T,V,B

donde
hN i =

V
4 2

2m
h2

3/2 Z
0

1/2 1 + z 1 e0 B

o1

(11.41)

es facil ver que

M =
B

11.2.1.

T,V,

= 0 (hN+ i hN i)

(11.42)

Magnetizaci
on en el estado fundamental

Para
z eF
donde F es la energa de Fermi, esto es, el potencial qumico a T = 0. Por ejemplo, el integrando
de hN+ i se comporta como
1
1+

z 1 exp (

0 B)

1
1 + exp [ ( 0 B F )]

1 0 B F < 0
0 0 B F > 0

(11.43)

As

hN+ i =
=

2m 3/2 F +0 B 1/2
V
d
4 2
h2
0

2m 3/2
2 V
(F + 0 B)3/2
2
2
3 4
h

(11.44)

De la misma manera obtenemos

2 V
hN i =
3 4 2

2m
h2

3/2

(F 0 B)3/2

(11.45)

Tenemos entonces
1V
hN i =
6 2
1V
M=
6 2

2m
h2

2m
h2

3/2 h

(F + 0 B)3/2 + (F 0 B)3/2

3/2

0 (F + 0 B)3/2 (F 0 B)3/2

(11.46)
i

(11.47)

Escribiendo
1V
hN i =
6 2

2m
h2

3/2

3/2

(1 + 0 B/F )3/2 + (1 0 B/ F )3/2

(11.48)

146

h
i
1 V 2m 3/2
3/2
3/2
3/2
M=

(1
+

B/
)

(1

B/
)
0
0
0
F
F
F
6 2 h2
podemos desarrollar para campos debiles 0 B F :

1V
hN i =
3 2
V
M= 2
2

2m
h2

2m
h2

3/2

3/2

3/2
0 F

3/2
F

"

+O

0 B
F

0 B
F
"

+O

(11.49)

2 #

(11.50)
0 B
F

3 #

(11.51)

Asi, tenemos que, para campos debiles

3
0 B
M hN i 0
(11.52)
2
F
esto es, la magnetizacion es directamente proporcional al campo magnetico B y por lo tanto la
susceptibilidad a campo nulo es constante y positiva:
1
0 =
V

M
B

V,N

=
T =0,B=0

320
2F

(11.53)

Este es uno de los resultados caractersticos del paramagnetismo de Pauli.

11.2.2.

Magnetizaci
on en el lmite degenerado T TF

A temperatura finita la magnetizacion viene dada por


M

= 0 (hN+ i hN i)
V
4 2

2m
h2

3/2

Z
0

1/2 {f ( 0 B) f ( + 0 B)} d

(11.54)

donde
1
(11.55)
1 + z 1 ex
es la distribucion de Fermi. Vamos a hacer ahora un desarrollo de las funciones f (x) en el integrando
de la Ec.(11.54) para campos debiles B 1. Conservando el primer orden no nulo en el desarrollo
tenemos
f (x) =

2m 3/2 2
V

B
1/2 f 0 ()d
2
0
2
h2

Z
V
2m 3/2 2
=
0 B
1/2 f ()d
2
4 2
h
0

(11.56)

donde en el u
ltimo paso hemos integrado por partes. De la misma manera tenemos que

hN i
=

V
2m 3/2 1/2
{f ( 0 B) + f ( + 0 B)} d
4 2 h2
0

Z
2m 3/2 1/2
V
f ()d
2 2 h2
0

(11.57)

147
La ecuacion anterior puede re-escribirse como
hN i = 2V 3T f3/2 (z)

(11.58)

donde f3/2 (z) viene dada por la Ec.(9.11), esto es, la ecuacion correspondiente al caso sin campo
externo, de la cual se determina en funcion de T y . Asi, para campos debiles y bajas temperaturas
T TF tenemos de las Ecs.(9.31) y (9.26) que
"

= F

2
1
12

kB T
F

(11.59)

con
2 2 2/3
h
3
(11.60)
2m
Por otra parte, puede obtenerse un desarrollo asint
otico de la integral de la Ec.(11.56), utilizando el
mismo metodo que usamos para obtener f3/2 (z) a bajas temperaturas, esto es, integrando primero
por partes, desarrollando luego el factor 1/2 resultante en serie de Taylor alrededor de = e
integrando termino a termino. Obtenemos asi
F =

32 B hN i
M= 0
2F

1/2 "

2
1
12

kB T

(11.61)

Usando la Ec.(11.59) obtenemos


"

32 B hN i
2
M= 0
1
2F
12

kB T
F

(11.62)

de donde podemos obtener la susceptibilidad a campo nulo


"

2
32
0 = 0 1
2F
12

kB T
F

(11.63)

que incorpora la primera correccion debida a fluctuaciones termicas a la Ec.(11.53). Esta fue la
expresion obtenida por Pauli en su trabajo pionero, explicando la dependencia debil de la susceptibilidad con la temperatura que ocurre en los metales alcalinos, para los cuales TF es muy
grande.

11.2.3.

Lmite de altas temperaturas

Para altas temperaturas tenemos que z 1. Asi


f (x) zex

(11.64)

esto es, la distribucion de Fermi tiende a la distribucion de Maxwell-Boltzmann. Reemplazando en


las Ecs.(11.54) y (11.57) tenemos que
V 0 z
M=
2 2
Vz
hN i = 2
2

2m
h2
2m
h2

3/2

senh(0 B)
3/2

cosh(0 B)

Z
0

Z
0

1/2 e d

(11.65)

1/2 e d

(11.66)

148
Combinando estas ecuaciones obtenemos

M = 0 hN i tanh

0 B
kB T

(11.67)

de donde la susceptibilidad a campo nulo resulta


0 =

20
kB T

(11.68)

Esta u
ltima expresion se conoce como ley de Curie, siendo caracterstica de la mayora de los
sistemas paramagneticos. Estas expresiones son las mismas que se obtienen considerando un sistema
de N spines distinguibles en el ensamble canonico. Vemos asi que dicho resultado corresponde al
lmite clasico, en el sentido de la distinguibilidad de las partculas, de un gas de electrones con spin.

11.3.

Ferromagnetismo

Uno de los fenomenos mas interesantes de la fsica del estado solido es el ferromagnetismo, esto
es, materiales cristalinos que permanecen magnetizados a
un en ausencia de un campo externo. De
hecho, historicamente este fue el primer fenomeno magnetico en ser descubierto1 y el que origino el
estudio del magnetismo en los albores de la fsica. Sin embargo, el problema es de tal complejidad
que a
un hoy existen aspectos que no se comprenden completamente.
Desde un punto de vista microscopico el ferromagnetismo se presenta como un fenomeno cooperativo, en el cual una fraccion macroscopica de spines (es decir, momentos magneticos) se orientan
mas o menos en la misma direccion por debajo de cierta temperatura crtica (en muchas casos
bastante alta). Como ya hemos visto, sistemas de partculas no interactuantes no presentan ferromagnetismo, esto es, la magnetizacion se anula siempre a campo nulo. La pregunta es entonces, que
tipo de interaccion es capaz de dar lugar a un ordenamiento espontaneo, coherente, de los momentos
magneticos? Sabemos que existen fuerzas de interacci
on magneticas entre dipolos permanentes, las
cuales dependen de la orientacion relativa de los dipolos y decaen con la distancia. No obstante, los
valores tpicos de la energa de interaccion entre dos dipolos atomicos son sumamente peque
nas (del
orden de 104 eV , lo cual equivale a temperaturas del orden del grado Kelvin) siendo insuficientes
para explicar el ordenamiento a temperaturas razonablemente altas, en muchos casos superiores a la
temperatura ambiente. Por otro lado, las energas electrostaticas entre electrones o entre electrones
y iones, son suficientemente intensas como para explicar un ordenamiento a las temperaturas observadas. En 1930 Heisenberg, Dirac y otros propusieron un mecanismo que combina la interacci
on
coulombiana entre electrones con el principio de exclusion de Pauli.

11.3.1.

Interacciones de intercambio: el modelo de Heisenberg

A fin de ilustrar como una interacci


on electrostatica combinada con el principio de exclusion
de Pauli puede dar lugar a una interacci
on magnetica efectiva, vamos a considerar el caso de dos
electrones interactuantes en una molecula de hidrogeno. Esto es vamos a analizar las funciones de
onda para dos electrones en un potencial que resulta de dos nucleos hidrogenoides localizados a
cierta distancia fija entre s. Podemos pensar este sistema como un solido conformado juntando
N = 2 atomos con un electron de valencia cada uno. Si despreciamos las interacciones spin-orbita,
el Hamiltoniano H de este sistema no depende del spin. Asi, la solucion general de la ecuacion
estacionaria H = E factoriza en una parte puramente orbital (~r1 , ~r2 ), solucion de la ecuacion
1

La existencia de la magnetita Fe3 O4 , imanes naturales que se encontraban en la provincia de Magnesia y de ahi
su nombre, era conocida por los antiguos griegos. Sin embargo, existen evidencias brujulas a base de magnetita en
China entre el 3000 y el 2500 a.C..

149

2 2
h
1 + 22 + V (~r1 , ~r2 ) = E,
(11.69)
2m
y una parte dependiente del spin de los electrones; esta u
ltima se construye como combinaci
on
lineal de los estados

H =

|1 i1 |2 i2
donde |i ii es el autoestado de la matriz de Pauli iz asociada a la partcula i correspondiente al
autovalor i =, .
El principio de exclusion de Pauli impone que la funcion de onda total sea antisimetrica,
lo cual puede obtenerse exigiendo que la parte orbital sea simetrica y la de spin antisimetrica o
viceversa2 . Resulta conveniente elegir como funcion de spin los autoestados del spin total S 2 y su
componente S z , ya que estas seran cantidades conservadas. Dichos estados a la vez tienen paridad
definida, de manera que podemos designarlos seg
un su paridad:
1
A (1 , 2 ) = (|i1 |i2 |i1 |i2 )
2

(11.70)

la funcion antisimetrica que corresponde al singlete de spin total S = 0 y

|i1 |i2

S (1 , 2 ) =

1
2

(|i1 |i2 + |i1 |i2 )


|i1 |i2

(11.71)

las funciones simetricas correspondientes al triplete, compuesto por los autoestados de spin total
S = 1 y de S z con autovalores 1, 0 y 1 respectivamente.
Los dos tipos de funciones de onda globalmente antisimetricas tienen entonces la forma:
s (~r1 , ~r2 ) = S (~r1 , ~r2 )A (1 , 2 )

(11.72)

con la parte posicional simetrica y la parte de spin antisimetrica y


t (~r1 , ~r2 ) = A (~r1 , ~r2 )S (1 , 2 )

(11.73)

con la situacion invertida.


La primera aproximacion a este problema consiste en despreciar la interacci
on electron-electr
on
y obtener las autofunciones orbitales de partculas independientes para luego combinarlas de manera
de obtener las propiedades de paridad requeridas. Una vez obtenidas las autofunciones orbitales
A,S , la interaccion electron-electron puede ser considerada perturbativamente, esto es, a primer
orden se considera el valor medio del potencial coulombiano en los diferentes estados orbitales.
Existen distintas aproximaciones para obtener las funciones de onda orbitales A,S . Una aproximacion particularmente indicada para generalizar el tratamiento a un solido (es decir, a un sistema
de N atomos) es considerar inicialmente los dos atomos separados a una distancia muy grande,
cada uno con un electron en un estado orbital hidrogenoide i (~r), i = 1, 2, donde el subndice
i indica el nucleo en el cual esta centrado el orbital. Si la energa del orbital es 0 , entonces el
estado fundamental de este sistema es 20 , el cual tiene degeneracion cuatro, correspondiente a
las diferentes orientaciones relativas de cada spin electronico. Los estados singlete y triplete estan
por lo tanto degenerados: Es = Et = 20 . Al acercarse los atomos se producira una superposicion
de los orbitales y las autofunciones del (11.69) ya no corresponderan al producto de los orbitales
aislados. Esto dara lugar un desdoblamiento de este nivel, levant
andose la degeneracion entre la
2

Notemos que siempre podemos elegir las autofunciones del Hamiltoniano (11.69) con paridad bien definida, en
virtud de la simetra ante intercambio de partculas del potencial V (~r1 , ~r2 )

150
energa del singlete Es y la del triplete Et ; los tres estados del triplete contin
uan degenerados, ya
que la interaccion es independiente del spin y los tres estados tienen la misma parte orbital. De
hecho es posible demostrar que el estado fundamental exacto del Hamiltoniano (11.69) corresponde
al una funcion orbital simetrica y por lo tanto al estado singlete.
Si el orbital (~r) es una funcion muy localizada en el nucleo, la superposicion de orbitales localizados en diferentes nucleos sera peque
na as como el desdoblamiento del nivel. As, una posible
aproximacion de las funciones orbitales consiste en utilizar combinaciones simetricas y antisimetricas de orbitales localizados en diferentes nucleos, esto es
S,A (~r1 , ~r2 ) = 1 (~r1 )2 (~r2 ) 2 (~r1 )1 (~r2 )

(11.74)

Esta eleccion se conoce como aproximaci


on de Heitler-London. Su generalizacion al caso de
N atomos constituye una buena aproximaci
on a los solidos aislantes. En ausencia de interacci
on
entre los electrones, la aproximacion anterior puede ser muy mala, ya que excluye combinaciones
de orbitales localizados ambos en el mismo nucleo; en ausencia de repulsion entre electrones esta
contribucion puede ser importante. Sin embargo, esta u
ltima situacion elevara mucho la energa
en presencia de repulsion coulombiana y por lo tanto la aproximaci
on de Heiter-London resulta
apropiada en este caso.
El desdoblamiento entre niveles Es Et debido a la interacci
on electron-electr
on puede calcularse
entonces de manera perturbativa como

! + *
! +
e2
e2

s
t

r12 s
r12 t

Es Et =

(11.75)

Reemplazando la Ec.(11.74) y usando que el potencial de interacci


on es simetrico ante el intercambio
*
1 ) 2 tenemos que

!
+
e2

Es Et = 4 1 (~r1 )2 (~r2 )
r ) (~r )
(~
r12 2 1 1 2
*

(11.76)

El segundo termino en la ecuacion anterior es un elemento de matriz entre dos estados que difieren
entre s solamente a traves del intercambio de las coordenadas de los electrones y de ahi que se lo
denomina t
ermino de intercambio.
En las condiciones en que resulta valida la aproximaci
on de Heiter-London, el desdoblamiento
del estado fundamental es peque
no comparado con las otras energas de excitacion del sistema
de dos electrones. Asi, las propiedades del sistema, al menos a temperaturas relativamente bajas,
estaran dominadas por estos cuatro estados. En el subespacio de estos estados podemos construir
~i = ~i /2, i = 1, 2, los operadores de spin
un Hamiltoniano efectivo de acuerdo a lo siguiente. Sean S
asociados
on, donde ~i son matrices de Pauli (hemos tomado h
= 1). Tenemos que
con cada electr
1
3
1
2
~
~ =
S
i
2 2 + 1 = 4 , de manera que el operador de spin total S satisface:

~2 = S
~1 + S
~2
S

3
~1 .S
~2
+2S
2

(11.77)

y por lo tanto los estados singlete y triplete son tambien autoestados del operador
~1 .S
~2 = 1 S
~2 3
S
2
4

(11.78)

~ 2 tiene autovalores S(S + 1), el operador (11.78) tiene autovalor 3/4 en


Dado que el operador S
el singlete (S = 0) y 1/4 en el triplete (S = 1). En consecuencia, el operador
1
~1 .S
~2
H = (Es + 3Et ) (Es Et )S
4

(11.79)

151
tiene autovalor Es cuando aplicado al singlete y autovalor Et cuando aplicado a cualquiera de los
estados del triplete. Redefiniendo el cero de energa tenemos el Hamiltoniano efectivo
~1 .S
~2
H = J S

J = Es Et

(11.80)

que representa una interaccion magnetica efectiva entre los spines electronicos, la cual se conoce
como interacci
on de intercambio. Esta interacci
on favorece que los spines esten alineados si
J > 0 y antialineados si J < 0. Esto se corresponde con el hecho de que los spines se encuentran
antialineados en el singlete (Es < Et J < 0) y alineados en los estados triplete (Es > Et J >
0); J se conoce como constante de intercambio. Esta interacci
on magnetica efectiva es resultado
combinado de las interacciones coulombianas y las exigencias de antisimetra de las funciones de
onda exclusivamente.
Para un cristal regular con N atomos, si bien el tratamiento es mas complicado, se arriba
basicamente al mismo resultado. En este caso, el estado fundamental de N atomos muy separados
correspondiente a un orbital localizado tiene una degeneracion 2N . El desdoblamiento de estos
niveles en el caso en que los iones se encuentran cerca, pero a
un lo suficientemente distanciados como
para que el desdoblamiento de energa sea peque
no comparado con otras energas de excitacion,
viene dado por el Hamiltoniano de Heisenberg:
H = J

~i .S
~j
S

<i,,j>

(11.81)
P

donde los operadores de spin se encuentran asociados con los sitios del cristal y la suma <i,,j> corre
sobre sitios primeros vecinos. Esto se debe a que la integral de intercambio involucra superposiciones
de funciones de onda localizadas, las cuales son apreciables en general solo entre sitios primeros
vecinos.
Lo que es mas notable es que el Hamiltoniano de Heisenberg describe una gran variedad de
casos, incluyendo situaciones en las cuales las funciones de onda de atomos individuales esta lejos
de ser consideradas orbitales localizados, como es el caso de los metales. De hecho, es posible en
ciertas circunstancias derivar un modelo de Heisenberg efectivo en metales a partir de la teora
de bandas3 Dependiendo del tipo de orbitales la constante de intercambio puede adoptar valores
positivos o negativos. El primer caso describe un material ferromagnetico, cuyo estado fundamental
corresponde a todos los spines alineados, en tanto que el segundo describe un sistema antiferromagn
etico, el cual describiremos mas adelante. No obstante, a diferencia del caso N = 2 antes
descripto, en el caso general no se conoce el espectro completo del Hamiltoniano (11.81).

11.3.2.

Modelos derivados del modelo de Heisenberg

El modelo de Heisenberg ferromagnetico presenta magnetizacion espontanea, con una temperatura crtica Tc > 0, en cristales tridimensionales. En cristales uni o bidimensionales la magnetizacion a campo nulo es cero para toda temperatura finita.
La mecanica estadstica del modelo de Heisenberg resulta extremadamente complicada de obtener, ya que ni siquiera se conoce de manera exacta el espectro del Hamiltoniano (11.81). No obstante,
la fenomenologa de la transicion de fase ferromagnetica puede analizarse utilizando modelos mas
sencillos, los cuales pueden derivarse del de Heisenberg.
Las interacciones de intercambio presentes en el modelo de Heisenberg son totalmente isotropicas. No obstante, en solidos reales los electrones presentan acoplamientos spin-orbita con las distribuciones de carga de los iones en el cristal. Esta distribuciones de carga tienen a menudo las
simetras del cristal, dando lugar a campos magneticos efectivos en las direcciones de ejes cristalinos, las cuales introducen anisotropas en las interacciones de intercambio. Estas anisotropas dan
3

D. C. Mattis, The Theory of Magnetism made Simple, World sicentific, 2006.

152
lugar a lo que se conoce como ejes faciles de magnetizacion, esto es, sistemas en los cuales la
magnetizacion espontanea ocurre preferencialmente en la direccion de algun eje particular. Una
manera posible de describir estos sistemas es mediante el modelo de Heisenberg anisotr
opico:
H=

X h

Jz Siz Sjz + Jxy Six Sjx + Siy Sjy

(11.82)

<i,,j>

El lmite Jz 0 del Hamiltoniano (11.82)


X

Hxy = Jxy

Six Sjx + Siy Sjy

(11.83)

<i,,j>

se conoce como modelo XY o planar. En el lmite Jxy 0 tenemos el Hamiltoniano


H=

Jz X z z

4 <i,,j> i j

(11.84)

donde iz es una matriz de Pauli asociada con el sitio i. Este Hamiltoniano es diagonal en la base
de estados
N
Y

|i i

i=1

con autovalores
H ({i }) =

Jz X
i j
4 <i,,j>

(11.85)

donde i = 1. La funcion H ({i }) corresponde al Hamiltoniano de Ising. A veces este modelo


es considerado clasico, en el sentido de estar descripto por variables de estado discretas en lugar
de operadores en un espacio de Hilbert. Sin embargo, su orgen es netamente cuantico. De hecho el
modelo de Ising, a pesar de su extrema simplificacion, describe correctamente el comportamiento
termodinamico de diversos materiales magneticos reales. En el captulo siguiente anlizaremos la
mecanica estadstica de este modelo.

Captulo 12

El modelo de Ising
El modelo de Ising 1 es uno de los pocos modelos de particulas interactuantes para el cual se
conoce su solucion exacta e indudablemente el mas simple de todos ellos. Este modelo tiene enorme
intereres por diversas razones. Por un lado resulta interesante su papel en el desarrollo historico de
la comprension del ferromagnetismo y de las transiciones de fase, en cuyo proceso represent
o un
papel fundamental. En segundo lugar, el metodo de solucion en una dimension presentado por Ising
y luego extendido a dos dimensiones por Onsager, constituye la base de diversos metodos modernos
de calculo en la fsica estadstica de los fenomenos crticos. Finalmente, hoy se sabe que el modelo de
Ising y generalizaciones del mismo sirven para explicar una variedad de fenomenos, no solo fsicos
(como veremos mas adelante), como tambien de diversas areas de la biologa.

12.1.

Modelo de Ising en una dimensi


on: soluci
on exacta

En una dimension (d = 1) el Hamiltoniano de Ising puede ser escrito de la forma


H = J

N
X

i i+1 B

i=1

N
X

(12.1)

i=1

donde i = 1 y vamos a utilizar condiciones de contorno periodicas, esto es


i+N = i
En una dimension, las condiciones de contorno periodicas son equivalentes a resolver el problema
en un anillo. Asi, podemos escribir el Hamiltoniano (12.1) de manera mas simetrica:
H = J

N
X

i i+1

i=1

N
BX
(i + i+1 )
2 i=1

(12.2)

La funcion de particion canonica viene dada por


ZN

"

N
hX
=
exp K
i i+1 +
(i + i+1 )
2 i=1
i=1
{ }

N
X

(12.3)

donde K J y h B. Notemos que la funcion de particion puede ser escrita de la forma


ZN =

1 =1 2 =1
1

N
X Y

N =1 i=1

E. Ising, Z. Phys. 31, 253 (1925).

153

T (i , i+1 )

(12.4)

154
donde

h
T (i , i+1 ) = exp Ki i+1 + (i + i+1 )
2

(12.5)

Esta u
ltima expresion puede ser interpretada como un elemento de una matriz 2 2 simetrica,
indexada por los valores de las variables de spin i = 1. Definimos entonces la matriz de
transferencia:

T (+1, +1) T (+1, 1)


T (1, +1) T (1, 1)

T=

eK+h eK
eK eKh

(12.6)

Asi, podemos escribir la funcion de particion como

ZN

1 =1 3 =1

1 =1 4 =1

..
.
=

N =1

T (1 , 2 )T (2 , 3 ) T (3 , 4 ) . . . T (N , 1 )

2 =1

N =1

(12.7)

T 2 (1 , 3 )T (3 , 4 ) T (4 , 5 ) . . . T (N , 1 )

(12.8)

3 =1

(12.9)
N

T (1 , 1 )

1 =1

= Tr TN

(12.10)

(12.11)

La matriz T es simetrica por construccion y por lo tanto sus autovalores son reales. Si son los
autovalores de T entonces
N
ZN = N
+ +

(12.12)

Los autovalores resultan

= e

cosh(h)

cosh (h)

2 e2K senh(2K)

(12.13)

A campo nulo h = 0 tenemos


+ = 2 cosh(K) = 2 senh(K) > 0
y en general + 0. Si escribimos
"

ZN = N
+ 1+

N #

(12.14)

tenemos entonces el lmite termodinamico N para la energa libre por partcula

kB T
f (T, B) = lm
ln ZN = kB T ln +
N
N

q
1
2
2J
= J ln cosh(B) + cosh (B) 2 e
senh(2J)

(12.15)
(12.16)

que es una funcion analtica de T y B. Notemos que, a diferencia de los gases, en este caso el
lmite termodinamico se toma como N en lugar de V . En general al tratar con

155

(a)

(b)

Figura 12.1: (a) Estado fundamental del modelo de Ising unidimensional. (b) Pared de dominio.
modelos en redes V y N son variables dependientes, de manera que solo una de ellas es relevante
termodinamicamente. Habitualmente se escoge el n
umero de partculas, esto es, el n
umero de sitios
en la red.
La magnetizacion por spin esta dada por

m(T, B) =

f
B

senh(B)

=q
T

(12.17)

cosh (B) 2 e2J senh(2J)

Vemos que m 0 cuando B 0, para toda T 6= 0, y por lo tanto este sistema no presenta
transicion de fase a temperatura finita, esto es, se comporta como un paramagneto a toda temperatura. Podemos calcular tambien la entropa por spin s(T, B) = (f /T )B , y a mediante esta el
calor especfico a campo constante

CB=0 = T

s
T

= T
B=0

2f
T 2

=
B=0

J2
1

2
2
kB T cosh

(12.18)

kB T

que es tambien una funcion analtica para toda T > 0.


Existe un argumento atribuido a Landau para mostrar que no es posible tener un estado ordenado a temperatura finita (y, por lo tanto, una transicion de fase) en un sistema unidimensional
con interacciones de corto alcance. Aplicado al modelo de Ising es como sigue.

El estado fundamental del modelo unidimensional, en ausencia de campo, es una cadena con
todos los spines alineados, tal como se muestra en la Fig.12.1a. Este es el mnimo absoluto de
la energa. Veamos ahora la configuracion de spines de la Fig.12.1b. Esta corresponde a dos dominios magneticos2 con magnetizaciones opuestas separados por dos paredes de dominio (estamos
2

Un dominio se define como una regi


on conexa con todos los spines alineados. Una pared de dominio es la interface
que separa dos dominios.

156
suponiendo siempre condiciones de contorno perodicas; la extension del argumento a una cadena
abierta es directa). La diferencia de energa entre esta configuracion y el estado fundamental es
U = 4J (2J es el costo energetico de cada pared). Por otra parte, el conjunto de las configuraciones con una pared de dominio tiene una entropa muy grande S = kB ln N , ya que las paredes
pueden ser colocadas en N posiciones distintas de la cadena (anillo). A temperatura finita, la diferencia de energa libre entre el estado fundamental y el estado con dos dominios de magnetizacion
opuesta es
F = 2J kB T ln N

(12.19)

En el lmite termodinamico N la expresion anterior se vuelve negativa, favoreciendo por lo


tanto la creacion de dominios. Dado que la magnetizacion promedia a cero en el conjunto de configuraciones dos dominios, el estado ordenado resulta inestable frente a un estado de magnetizacion
nula a cualquier temperatura finita. El modelo de Ising solo ordena para T = 0, por lo cual se dice
que presenta una transicion de fase a temperatura cero.
Este argumento puede extenderse a todo tipo de modelos unidimensionales con interacciones
de corto alcance.

12.2.

Modelo de Ising en dos dimensiones

El modelo bidimensional fue resuelto por primera vez usando la tecnica de matriz de transferencia por Onsager 3 con campo nulo y por Yang 4 con campo magnetico. Posteriormente fue resuelto
por diferentes autores usando diferentes tecnicas de calculo 5 . En cualquiera de ellas, la resolucion
es muchsimo mas complicada que en el caso unidimensional. Nos limitaremos aqui a presentar los
resultados principales y discutiremos sus consecuencias.
En el lmite termodinamico (en la red cuadrada y a campo nulo) la energa libre por partcula
resulta
1
f (T ) = ln (2 cosh 2J)
2

Z
0

q
1
1 + 1 2 sen2
d ln
2

(12.20)

donde
=

2 senh(2J)
cosh2 (2J)

(12.21)

La energa interna por spin viene dada por


u(T ) =
donde () =

d
(f (T ))
= 2J tanh (2J) +

2 d

Z
0

sen2
(1 + )

(12.22)

1 2 sen2 . Se verifica facilmente que


Z
0

sen2
1
= 2
(1 + )

Z
d
0

()

(12.23)

Reemplazando en la Ec.(12.22) obtenemos, con algo de trabajo, que

u(T ) = Jcoth(2J) 1 +
3

2 0
K1 ()

(12.24)

L. Onsager, Phys. Rev. 65, 117 (1944); B. Kaufman, Phys. Rev. 76, 1232 (1949); B. Kaufman y L. Onsager,
Phys. Rev. 76, 1244 (1949).
4
C. N. Yang, Phys. Rev. 85, 809 (1952).
5
T. D. Schultz, D. C. Mattis y E. H. Lieb, Rev. Mod. Phys. 36, 856 (1964).

157
donde
K1 ()

Z /2

d
1 2 sen2

(12.25)

p
0

es una integral elptica completa de primera especie y


0 2tanh2 (2J) 1
2 + 02 = 1
Derivando la Ec.(12.24) podemos obtener, con cierto trabajo, el calor especfico

du(T )
2kB

c(T ) =
=
(Jcoth(2J))2 2K1 () 2E1 () (1 0 ) 0 K1 ()
dT

(12.26)

donde
E1 ()

Z /2
0

d 1 2 sen2

(12.27)

es una integral elptica completa de segunda especie.


La integral elptica K1 () tiene una singularidad en = 1 (0 = 0), en cuyo entorno tenemos
que
K1 () ln

4
|0 |

E1 () 1
En dicho punto todas las funciones termodinamicas son no-analticas. La temperatura crtica resulta
entonces de la condicion
=

2 senh(2c J)
=1
cosh2 (2c J)

(12.28)

o bien de 0 = 0
2tanh2 (2c J) = 1

(12.29)

de donde resulta
kB Tc /J =

ln 1 +

.
2

(12.30)

Otra relacion satisfecha por Tc es


senh2 (2c J) = 1.

(12.31)

En el entorno de Tc tenemos entonces que


2kB
c(T )

Pero

2J
kB T c

ln 0

(12.32)

158

0 = 2tanh2 (2J) 1 = 2tanh2 (2J) 2tanh2 (2c J) D(T Tc )


donde D es una constante. Asi
2kB
c(T )

2J
kB Tc

ln 1
T

(12.33)

esto es, c(T ) presenta una singularidad logartmica, en contraste con la prediccion de campo medio
de una discontinuidad.
El parametro de orden, esto es, la magnetizacion por partcula es

0
n
o1/8
m(T ) =
1 [senh(2J)]4

T > Tc

(12.34)

T Tc

En el entorno del punto crtico tenemos que


h

i1/8

m(T ) senh4 (2J) senh4 (2c J)

A(Tc T )1/8

(12.35)

donde A es una constante. El exponente crtico del parametro de orden resulta entonces = 1/8.
En dimensiones d 3 no se conoce hasta hoy la solucion exacta del modelo Ising en ning
un
tipo de red. Sin embargo, existen numerosas soluciones aproximadas , as como resultados de simulaciones numericas, las cuales permiten obtener la temperatura crtica y los exponentes crticos
en 3 dimensiones. En particular, el exponente crtico para la magnetizacion resulta independiente
del tipo de red cristalina y es 1/3, en concordancia con el exponente crtico para la transicion
gas-lquido (la independencia de los exponentes crticos de los detalles microscopicos del sistema se
conoce como universalidad).

12.3.

Aproximaci
on de campo medio

Una aproximacion no controlada de enorme uso es la que se campo medio y se basa en la teora
del ferromagnetismo de Weiss. Si bien esta aproximaci
on no describe quantitaivamente bien los
resultados experimentales, es de enorme importancia teorica, debido especialmente a su simplicidad.
La misma puede desarrollarse como sigue.
Si consideramos un sistema con invariancia traslacional (red infinita o finita con condiciones de
contorno periodicas), tendremos que la magnetizacion local hi i ser
a hi i = m independiente del
sitio particular i, donde m es la magnetizacion por spin:
m=

N
1 X
hi i
N i=1

Podemos entonces escribir el Hamiltoniano como sigue


X h

(i m)(j m) + m(i + j ) m2 B

H = J

<i,,j>

(12.36)

Sea q el n
umero de primeros vecinos de un sitio (propiedad de la red particular), el cual se conoce
como n
umero de coordinaci
on. El Hamiltoniano (12.36) puede escribirse como
H=

X
X
qN 2
m J (q J m + B)
i J
i j
2
i
<i,,j>

(12.37)

159
donde i i m es una variable aleatoria que representa las fluctuaciones en la magnetizacion del
sitio i. La aproximacion de campo medio consiste entonces en despreciar el termino de fluctuaciones
en el Hamiltoniano (12.37), con lo cual obtenemos
Hcm =

X
qN 2
m J Bef
i
2
i

(12.38)

donde Bef q J m + B. En esta aproximaci


on entonces, el sistema es descripto por un conjunto de
spines independientes en presencia de un campo efectivo generado por la magnetizacion promedio de
sus vecinos mas el campo externo. Este corresponde al campo medio o campo molecular introducido
por Weiss. La funcion particion resulta entonces

Zcm = exp(q N m2 J/2)

eBef

= exp(q N m2 J/2) [2 cosh(Bef )]N

(12.39)

=1

y la energa libre por spin


kB T
1
ln Zcm = m2 J q kB T ln [2 cosh(Bef )]
(12.40)
N
2
Para que la aproximacion resulte consistente, al magnetizacion por spin m debe resultar
fcm =

eBef
1
Tr i eHcm = P=1 B = tanh( Bef f )
m = hi i =
ef
Zcm
=1 e

(12.41)

As, arribamos a la ecuacion autoconsistente para m:


m = tanh [(q J m + B)]

(12.42)

la cual se conoce como ecuaci


on de Curie-Weiss. La misma puede resolverse graficamente.
Tomemos el caso B = 0: m = tanh( q J m), cuya solucion se ilustra en la Fig.12.2. m = 0 es
siempee solucion. Cuando la pendiente de la tangente hiperbolica en el orgen es mayor que uno,
aparecen dos soluciones simetricas m = m0 (T ). La condicion para que ocurra esto u
ltimo es
entonces c J q = 1 o kB Tc = q J. Es posible ver que la solucion m = 0 representa un maximo de la
energa libre fcm para T < Tc . As, m0 (T ) corresponde a la magnetizacion espont
anea. Para B 6= 0,
solo existe una solucion estable (mnimo absoluto de la energa libre) para cualquier temperatura.
PAra temperatruas levemente menores que Tc tendremos que m0 1. As, podemos desarrollar la
Ec.(12.42) con B = 0 como
m0 = q J m0 + ( q J m0 )3 /3 + O(m50 )
de donde

m0 (T ) 3 1

T
Tc

1/2

El exponente crtico para la magnetizacion en la aproximaci


on de campo medio es por lo tanto
= 1/2. Notemos que este exponente es totalmente independiente de la dimension de la red (la
dimension en esta aproximacion entra solamente a traves del n
umero de coordinacion q), y difiere
de los valores exactos para d = 2 (1/8) y d = 3 (1/3). Mas a
un, esta aproximaci
on predice una
trnasicion de fase incluso para d = 1. Puede demostrarse que la aproximaci
on de campo medio para
el modelo de Ising se vuelve exacta en dimensiones d 4.

160

+1

T < Tc

T = Tc

T > Tc

- m0(T)
0

m0(T)

-1

Figura 12.2: Solucion grafica de la ecuacion de Curie-Weiss a campo externo nulo B = 0.

12.4.

El gas de red

Este es un modelo de partculas interactuantes para describir la transicion lquido-gas. En este


modelo las partculas solo pueden ocupar posiciones discretas en el espacio. De esta manera, podemos asociar a cada posicion un sitio o celda en una red de Bravais con N sitios. En otras palabras,
dividimos el espacio en celdas ubicadas regularmente, tal que cada celda puede alojar a lo sumo
una partcula. El n
umero de sitios N es proporcional al vol
umen del sistema. Como vimos en el
captulo 6, la funcion particion canonica puede descomponerse en una parte correspondiente a la
energa cinetica (gas ideal) y una parte configuracional. En el ensamble gran canonico, la primera
puede absorverse dentro del potencial qumico. Consideramos entonces solamente la parte configuracional y asumimos un potencial de interacci
on entre dos partculas del tipo carozo duro (es
decir, repulsion infinita) a muy cortas distancias y atractiva a distancias intermedias. El potencial
de carozo duro impone que en un sitio no puede haber mas de una partcula. Si llamamos u(|ri rj |)
al potencial de interaccion entre dos partculas ubicadas en las posiciones ri y rj , entonces:

u(r) =

r=0
0 r = 1

0
otro caso

(12.43)

(compare con el potencial de Lennard-Jones visto en el captulo 6). Asociamos a cada sitio i una
variable ni = 0, 1, tal que ni = 0 corresponde a un sitio vacio y ni = 1 a un sitio ocupado. Entonces,
P
a del gas
dada una configuracion de n sitios ocupados {n1 , n2 , . . . , nN }, con N
i=1 ni = n, la energ
sera
X

Hg = 0

ni nj

(12.44)

e(Hg n)

(12.45)

hi,,ji

y la funcion gran particion


Zg =

N X
X
n=0 {ni }

161
P

donde la suma {ni } es sobre todas las configuraciones de {ni } tales que
Hacemos ahora el cambio de variables

PN

i=1 ni

= n.

1
ni = (1 + i )
2
con i = 1. Tenemos que

X
0 X
(i + j ) +
i j
Hg =
4 hi,,ji
hi,,ji

(12.46)

donde hemos eliminado los terminos constantes. Se define el n


umero de coordinaci
on de la red como
el n
umero de primeros vecinos de un stio cualquiera. Tenemos entonces que

N
X
X
0
Hg = q
i +
i j
4
i=1
hi,,ji

(12.47)

Por otra parte


n=

N
X

ni =

i=1

N
1X
N
+
i
2
2 i=1

(12.48)

y asi

N
0 X
q0 X
N
i j
+
Hg n =
i
4 hi,,ji
2
4 i=1
2

(12.49)

Ademas
N X
X
n=0 {ni }

X
1 =1

...

N =1

Tenemos por lo tanto que


Zg = ZI eN/2

(12.50)

donde ZI es la funcion de particion de un modelo de Ising con J = 0 /4 y B = /2 + qJ. El


potencial gran canonico resulta entonces
g (T, , V ) = kB T ln Zg = FI (T, B = /2 + qJ, N )

N
2

(12.51)

Si consideramos una red hiperc


ubica en d dimensiones con parametro de red unitario tenemos que
V = N . Asi, la presion resulta
g

= fI (T, B = /2 + qJ) +
(12.52)
V
2
donde fI es la energa libre por spin. De la Ec.(12.48) obtenemos la segunda ecuacion de estado:
P =

hni
1
= [1 + m(T, B = /2 + qJ)]
N
2
donde m(T, B) es la magnetizacion por spin.
(T, )

(12.53)

162

m0(T)

m(T)

(b)

(a)

Tc

Tc

-1

-m0(T)

Figura 12.3: (a) Magnetizacion espontanea del modelo de Ising para d 2. (b) Linea de transicion
de primer orden.
El modelo de Ising en dimensiones d 2 presenta una transicion de fase de primer orden para
B = 0 y T < Tc , donde el parametro de orden cambia de manera discontinua de m0 (T ) a m0 (T ),
siendo m0 (T ) = lmB0+ m(B, T ) (ver Fig.(12.3)). En la versi
on gas de red, dicha trasicion ocurre
entre dos estados de diferente densidad
(T ) =

1
[1 m0 (T )]
2

correspondiendo por lo tanto a las fases lquida y gaseosa.

12.4.1.

Ejercicios

1. Incorpore la parte de energa cinetica (en la aproximaci


on clasica) a las ecuaciones de estado
del gas de red.
2. Resuelva numericamente la ecuacion de Curie-Weiss y grafique las curvas de coexistencia para
el gas de red en los espacios P vs. T y P vs. v = 1/, dentro de la aproximaci
on de campo
medio.

12.5.

Modelo de Ising antiferromagn


etico

Consideremos el Hamiltoniano de Ising con campo nulo y J < 0. En este caso la configuracion
ferromagnetica con todos los spines alineados resulta el maximo absoluto de la energa. El mnimo
absoluto debera corresponder ahora a una configuracion en la cual todo par de spines primeros
vecinos se encuentran anti-alineados. Es esto posible? Depende de la red. Evidentemente es posible
en la red unidimensional, como se muestra en la Fig.(12.4). Tambien es posible en la red cuadrada
como se muestra en la Fig.(12.5). Que tienen en comun estas redes? En ambos casos podemos
dividir la red en dos subredes A y B, tal que todo sitio de una de las subredes tiene como primeros
vecinos solamente sitios de la otra subred. En el caso de la cadena cada subred tiene parametro de

163

Figura 12.4: Orden antiferromagnetico en la cadena lineal.


red 2 (suponiendo el parametro de la red
original 1) y en la red cuadrada cada subred es a su vez
una red cuadrada con parametro de red 2. Redes que pueden ser subdivididas de esta manera
se dicen bipartitas. En estas redes el estado fundamental del Hamiltoniano de Ising corresponde
a cada una de las subredes en configuraciones ferromagneticas con magnetizacion opuesta. Estas
configuraciones se conocen como estados de N
eel
o antiferromagn
eticos. A fin de cuantificar
el orden antiferromagnetico se define como parametro de orden la magnetizaci
on staggered
(alternante):
ms mA mB

(12.54)

donde
*

mA =

1 X
i
N iA

mB =

1 X
i
N iB

(12.55)

A temperatura cero ms = 1. A temperatura finita existe orden antiferro en redes con d 2, esto es
ms (T ) 6= 0 por debajo de cierta temperatura crtica TN llamada temperatura de Neel. Para T > TN
se tiene que ms (T ) = 0. El estado antiferromagnetico tiene magnetizacion total nula para toda T .
Consideremos ahora la funcion particion del modelo de Ising a campo nulo:

Z(, J) =

X
{i }

exp J

i j

(12.56)

hi,ji

Introducimos una transformacion: i i i B. La funcion particion permanece invariante, ya


que la suma corre sobre todas las configuraciones de spines. Asi, tenemos que

164

= +1
= 1

Figura 12.5: Orden antiferromagnetico en la red cuadrada.

Z(, J) = Z( J)
Por otra parte, la aplicacion de esta transformacion al calculo de la magnetizacion nos da
m(, J) = ms (, J)
Asi, las soluciones para el modelo antiferromagnetico a campo nulo son completamente simetricas
con las del modelo ferromagnetico. En particular tendremos que TN = Tc , donde Tc es la temperatura crtica del modelo ferromagnetico. Esta simetra se rompe en presencia de campo magnetico.
En este caso el comportamiento del antiferro es completamente diferente del ferro. En el caso ferromagnetico la presencia de campo destruye la transicion de fase. En el caso antiferro la transicion
persiste y el efecto del campo es solamente alterar la temperatura crtica, creando una linea crtica,
tal como se muestra en la figura 12.6. En este caso el comportamiento de la magnetizacion m es la
de un paramagneto. De hecho el antiferromagnetismo fue propuesto por primera vez por Neel en
1932 como manera de explicar la susceptibilidad paramagnetica de metales como el Cr o el Mn, la
cual era mucha mas grande que la predicha por la teora de Pauli. En a
nos posteriores pudo ser
verificada la existencia del antiferromagnetismo mediante difraccion de neutrones. Hoy en da se
sabe que el antiferromagnetismo es mucho mas frecuente que el ferromagnetismo en la naturaleza.

Finalmente, en redes que no son bipartitas no existe orden antiferromagnetico. Tomemos como
ejemplo la red triangular y consideremos una celda unitaria. Es imposible hacer que todos los
pares esten antialineados. En esta situacion el mnimo de energa corresponde a dos spines en una
direccion y el tercero en la opuesta. Este estado tiene degeneracion 3. En la red completa la situacion
es parecida, aunque mucho mas compleja. Sistema con estas caractersticas se dicen frustrados,
y estan caracterizados por una degeneracion altsima del estado fundamental (infinita, en el lmite
termodinamico), sin ningun tipo de orden magnetico espacial.

165

linea crtica

m =0
ms = 0

m 50
ms 5 0

T
0

m =0
ms 5 0

TN

Figura 12.6: Diagrama de fases del modelo de Ising antiferromagnetico con campo externo.

S-ar putea să vă placă și