Sunteți pe pagina 1din 536

Temas que trata la obra:

• Redes cristalinas y tipos de cristales


• Análisis cristalográfico con rayos X
• Dinámica de las redes cristalinas
• Mecánica cuántica, generalidades
• Mecánica estadística, generalidades
• Vibraciones reticulares y propiedades
térmicas de los cristales
• Teoría del electrón libre de los metales
• Teorí~ cuántica de los electrones en
redes periódicas
• Semiconductores electrónicos uniformes
en equilibrio
• Exceso de portadores en
semiconductores
• Tecnología de materiales y medición de
propiedades volumétricas
• Teoría de las uniones p-n de los
semiconductores
• Rectificadores de la unión p-n y
transistores
• Uniones p-n a niveles altos de
corrientes; el rectificador p-i-n
• Otros dispositivos semiconductores
• Contactos metal-semiconductor y
superficies de semiconductores
,6flll""'

FISIC ,
DEL ESTADO SOLIDO Y DE
SEMICONDUCTORES

J. P. McKELVEY

~LIMUSA
NORIEGA EDITORES
MÉXICO • Eapel\a • Venezuela • Colombia
VERSIÓN AUTORIZADA EN ESPNIOL DE LA OBRA
PUBLICADA EN INGLéS CON EL TITULO:
SOLIO STATE ANO
SEMICONDUCTOR PHYSICS
O HARPER & Row PuBLISHERs, INc.

COLABORADOR EN LA TRADUCCIÓN:
HORTENSIA CORONA RODRÍGUEZ
INGENIERO DE LA UNIVERSIDAD DE CALIFORNIA,
8eRKELEY.

REVISIÓN:
FRANCISCO RESÉNDIZ RODRÍGUEZ
MAESTFÚA EN CIENCIAS EN INOENIERIA ELéCTRI•
CA DEL CeNTRO DE INVESTIGACióN Y EsTUDIOS
AVANZADOS, PROFESOR DE ELECTRÓNICA DE LA
EscueLA SuPERIOR DE INOENIERfA MECÁNICA
Y ELéCTRICA DEL INSTITUTO PouTéCNICO NA·
CIONAL, MéxiCO.

LA PRESENTACIÓN YDISPOSICIÓN EN CONJUNTO DE


FÍSICA DEL ESTADO SÓLIDO Y
DE SEMICONDUCTORES

SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE


ESTA OBRA PUEDE SER REPRODUCIDA O TRANS·
MlliDA, MEDANll: NfGÚN SISTBM O MÉlalO, B..EC·
TIÓIIICO o aECÑICO (N:W'fENX) afOitlCXlPWlO,
LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPE·
RACIÓN Y ALMACENAMIENTO DE INFORMACIÓN), SIN
CONSENTIMIENTO POR ESCRITO DEL EDITOR.

DERECHOS RESERVADOS:

O 1996, EDITORIAL LIMUSA, S.A. DE C.V.


GRUPO NORIEGA EDITORES
BALDERAS 95, MéJOCO, D.F.
C.P. 06040
i l 521·21.05
Q 512·29.03
CANIEM NúM. 121

NovENA RBMPRESIÓN

HECHO EN MéxiCO
ISBN 968·18·0431·7
Prólogo

Este libro se basa en el material que utilicé para impartir cursos especiales
de dos semestres a los estudiantes de las carreras de física, ingeniería
eléctrica, metalurgia y ciencias de materiales. Por lo común, el primer
semestre de estos cursos se dedica ala física general del estado sólido y el
segundo, a un estudio detallado de los materiales y dispositivos semiconduc-
tores, incluyéndose en él (además de una gran cantidad de material nuevo)
muchas aplicaciones de los principios desarrollados en la sección introducto-
ria del curso. Por consiguiente, la obra es fundamentalmente un libro de
texto para un curso de este tipo. Esperamos que su alcance sea lo
suficientemente amplio y la exposición de los aspectos fundamentales, lo
suficientemente detallada y clara para que también sirva como libro de
consulta general para los ingenieros y otros profesionales que trabajan en el
área de investigación y desarrollo de los materiales y dispositivos
semiconductores.
En vista de que este material puede interesar a los estudiantes y
profesionales de carreras muy diversas, se incluyeron los capítulos sobre
mecánica cuántica y mecánica estadística, por creer que serían muy útiles
para algunos. Sin embargo, cabe señalar que con estos capítulos no se
pretende suplir un curso completo de estos temas, ya que sólo se trata df.
breves ensayos introductorios que le proporcionan al lector los conocimien-
tos necesarios para seguir el desarrollo del tema y entender el significado
físico de los conceptos presentados. Desde luego, para apreciar debidamente
la importancia que tienen los fenómenos cuánticos y estadísticos en la física
del estado sólido, no queda otra, sino estudiarlos a fondo.
A lo largo de la obra, los temas se presentan desde el punto de vista de la
física; por otra parte, se incluyen muchos detalles técnicos sobre temas tales
como tecnología de materiales y crecimiento de cristales; fabricación de
dispositivos semiconductores; características y configuración de circuitos de
estos dispositivos, y para proporcionar un panorama más completo, se
indican las obras que conviene consultar, si se desea obtener datos más
concretos y detallados en relación con estos temas. Traté de presentar en
forma exhaustiva la teoría de la unión p-n y el análisis del dispositivo
semiconductor y dar una explicación completa y detallada de las técni<:as
analíticas que se utilizan en este campo tan importante, pero tan descuidado.
Prólogo 6

Los conceptos de la física general del estado sólido que se estudian en la


sección introductoria, capítulos del 1 al 8, sólo abarcan aquellos que tienen
una importancia central en la física de los semiconductores. Por lo tanto,
esta introducción es más bien selectiva que completa; peri, aun así, contiene
el material suficiente para un curso completo, de nivel intermedio, sobre la
física del estado sólido. Desde luego, un libro de texto de tamaño normal no
puede abarcar un estudio de dieléctricos, magnetismo, centros de color,
experimentos de resonancia y otros temas que por lo general se tocan en los
cursos de física del estado sólido.
El nivel de presentación es intermedio; he tratado de ir mucho más allá de
lo que puede lograrse con un enfoque cualitativo, sin recurrir realmente a la
mecánica cuántica y la mecánica estadística, a fin de evitar las tremendas
complejidades matemáticas requeridas para un planteamiento absoluto de la
teoría cuántica. La línea de mis planteamientos es pragmática bien que
axiómática y traté sistemáticamente de explicar todos los temas desde dos
puntos de vista, el físico y el matemático. A lo largo de la obra se hace
énfasis en los principios fundamentales y no en los detalles técnicos. Además,
con mucha frecuencia se recurre al planteamiento de la partícula tal y como
se explica en la teoría del transporte del electrón libre; este planteamiento se
justifica a la luz de la teoría cuántica que se subraya en el capítulo 8. No se
necesita tener conocimientos matemáticos más avanzados que el análisis
vectorial y de las ecuaciones diferenciales ordinarias. Aunque en varias
ocasiones aparecen las ecuaciones diferenciales parciales y expansiones de la
función ortogonal, siempre se proporcionan en seguida los medios
matemáticos necesarios para resolverlas.
Me es imposible expresar en forma adecuada mi gratitud a todos mis
colegas que han contribuido a esta obra. Sin embargo, quisiera dar las gracias
de un modo específico a los doctores D.R. Frankl, P.H. Cutler, J. Yahia y
H.F. John por sus útiles comentarios, observaciones y sugerencias, así como
al Dr. F .G. Brickwedde quien me autorizó a emplear su personal, cuando la
transcripción del manuscrito se retrasaba por alguna emergencia. Mis
antiguos alumnos, los doctores J.C. Balogh, M W. Cresswell y E.F. Pulver
también me ayudaron mucho leyendo, evaluando y corrigiendo partes del
manuscrito. También muchos de mis estudiantes me señalaron los errores
que hubo en las notas del manuscrito y sugirieron cómo mejorar la
exposición de algunos temas. No me puedo acordar de todas las personas que
me ayudaron; pero estoy profundamente agradecido a cada una de ellas.
También deseo expresar mi gratitud a la señorita Frances Fogle, a la señora
Marion Shaw y a la señorita Eileen Berringer por su inapreciable
colaboración en la transcripción del manuscrito.

J.P. MCKELVEY

University Park, Pa.


Contenido

Capítulo 1 Redes cristalinas y tipos de cristales 13

1.1 Concepto de estado "sólido", 13


1.2 Celdas unitarias y redes de Bravais, 14
1.3 Algunas estructuras cristalinas simples, 18
1.4 Planos cristalinos e índices de Miller, 23
1.5 Espaciamiento de los planos en las
redes cristalinas, 25
1.6 Clasificación general de los
cristales, 27
Capítulo 2 Análisis cristalográfico con rayos x 31

2.1 Introducción, 31
2.2 Física de la difracción de los rayos X: las
ecuaciones de V on Laue, 34
2.3 Factor de dispersión atómica, 37
2.4 Factor geométrico de la estructura, 40
2.5 La red recíproca, 43
2.6 La condición de Bragg en función de la red
recíproca, 47

Capítulo 3 Dinámica de las redes cristalinas 51


3.1 Vibraciones elásticas de medios continuos, 51
3.2 Velocidad de grupo de trenes de ondas
armónicas, 53
3.3 Movimiento ondulatorio en redes atómicas
unidimensionales, 55
3.4 Estructuras diatómicas unidimensionales, 62
3.5 Región de frecuencia prohibida, 65
3.6 Excitación óptica de vibraciones reticulares
en cristales iónicos, 6 7
3. 7 Energía de enlace de estructuras cristalinas
iónicas, 69
Contenido 8

Capítulo 4 Mecánica cuántica, generalidades 19

4.1 Introducción, 79
4.2 Radiación del cuerpo negro, 79
4.3 Efecto fotoeléctrico, 81
4.4 Calor específico de los sólidos, 83
4.5 El átomo de Bohr, 84
4.6 La hipótesis de De Broglie y las propiedades
ondulatorias de la materia, 8 7
4.7 Mecánica ondulatoria, 87
4.8 Dependencia del tiempo de la función de onda, 91
4.9 La partícula libre y el principio de
incertidumbre, 94
4.10 Una partícula en un pozo de potencial
unidimensional e infinitamente profundo, 100
4.11 Una partícula en un pozo unidimensional
de profundidad finita, 103
4.12 El oscilador armónico unidimensional, 111
4.13 Oetogonalidad de las funciones propias y
la superposición de estados, 119
4.14 Valores esperados y números cuánticos, 123
4.15 El átomo de hidrógeno, 128
4.16 El espín electrónico, el principio de
exclusión de Pauli y el sistema
periódico, 141

Capítulo S Mecánica estadística, generalidades 147


5.1 Introducción, 147
5.2 La función de distribución y la densidad
de los estados, 148
5.3 La distribución Maxwell·Boltzmann, 153
5.4 La estadística de Maxwell-Boltzmann para
un gas ideal, 161
5.5 Estadística de Fermi-Dirac, 168
5.6 La distribución Bose-Einstein, 176

Capítulo 6 Vibraciones reticulares y propiedades térmicas 181


de los cristales
6.1 Cálculos clásicos del calor específico
reticular, 181
6.2 Teoría de Einstein sobre el calor específico, 183
6.3 Teoría de Debye sobre el calor específico, 186
6.4 El fonón, 192
6.5 Expansión térmica de los sólidos, 193
6.6 Conductividad térmica reticular de los sólidos, 195
Contenido 9

Capítulo 7 Teoría del electrón libre de los metales 203


7.1 Introducción, 203
7.2 La ecuación de Boltzmann y la trayectoria libre media, 204
7.3 Conductividad eléctrica de un gas de electrones libres, 209
7.4 Conductividad térmica y efectos termoeléctricos en
sistemas de electrones libres, 215
7.5 Procesos de dispersión, 219
7.6 El efecto de Hall y otros efectos galvanomagnéticos, 222
7. 7 Capacidad térmica de sistemas de electrones libres, 225

Capítulo 8 Teoría cuántica de los electrones en redes periódicas 231

8.1 Introducción, 231


8.2 El teorema de Bloch, 232
8.3 El modelo de Kronig-Penney de un cristal infinito
unidimensional, 23 5
8.4 Cantidad de movimiento del cristal y masa efectiva, 240
8.5 Representación de zona reducida; electrones y huecos, 243
8.6 La aproximación del electrón libre, 248
8. 7 La aproximación del enlace firme, 255
8.8 Dinámica del electrón en estructuras bidimensionales
y tridimensionales; superficies de energía constante y
zonas de Brillouin, 260
8.9 Aisladores, semiconductores y metales, 269
8.10 Densidad de la función de estados y cambios de fase en
aleaciones binarias, 273

Capítulo 9 Semiconductores electrónicos uniformes en equilibrio 281

9.1 Semiconductores, 281


9.2 Semiconductores intrínsecos y semiconductores
con impurezas, 284
9.3 Estadística de huecos y electrones- El caso del
semiconductor intrínseco, 288
9.4 Energía de ionización de centros de impurezas, 292
9.5 Estadísticas de los semiconductores con impurezas, 295
9.6 El caso de la ionización incompleta de niveles de impureza
(Temperatura muy baja), 300
9. 7 Conductividad, 302
9.8 El efecto de Hall y la magnetorresistencia, 306
9.9 Resonancia de ciclotrón y superficies elipsoidales
de energía, 316
9.10 Densidad de estados, conductividad y efecto de Hall con
superficies complejas de energía, 327
9.11 Mecanismos de dispersión y movilidad de los portadores
de carga, 335
Contenido 10

Capítulo 1O Exceso de portadores en semiconductores 347

10.1 Introducción, 347


10.2 Comportamiento de transporte de los portadores excedentes; las
ecuaciones de continuidad, 348
10.3 Algunas soluciones particulares de la ecuación de
continuidad, 361
10.4 Movilidad de arrastre y el experimento de Haynes-Shockley, 371
10.5 Recombinación superficial y condiciones de frontera
superficiales, 3 74
10.6 F otoconductividad de estado estacionario, 3 79
10.7 Fotoconductividad transitoria; tiempo de vida de los
portadores en excedentes, 383
10.8 Mecanismos de recombinación; la teoría de recombinación
de Shockley-Read, 390

Capítulo 11 Tecnología de materiales y medición de propiedades •E 401


volumétricas
11.1 Preparación de los materiales semiconductores de alto
grado de pureza, 401
11.2 Crecimiento de muestras monocristalinas, 407
11.3 Medición de la resistividad volumétrica, 409
11.4 Medición del contenido de impurezas y la movilidad mediante
el efecto de Hall, 411
11.5 Medición del tiempo de vida de los portadores excedentes, 412
11.6 Dislocaciones y otras imperfecciones, 413

Capítulo 12 Teoría de las uniones p-n de los semiconductores 421

12.1 La unión p-n, 421


12.2 El potencial de contacto interno de equilibrio, 424
12.3 Potenciales y campos en las cercanías de una unión p-n, 426
12.4 Modelo matemático simplificado de la unión p-n abrupta, 429
12.5 Capacitancia de unión; determinación del potencial interno, 435

Capítulo 13 Rectificadores de unión p-n y transistores 439

13.1 Teoría del rectificador de unión p-n, 439


13.2 Corrientes y campos en los rectificadores de unión p-n, 44 7
13.3 Rectificadores de unión de tamaño finito; efectos de
superficies y terminales óhmicas, 452
13.4 Mecanismos físicos de ruptura en las uniónes p-n, 456
13.5 Técnicas de fabricación de la unión p-n, 460
13.6 Transistores de unión p-n-p- y n-p-n, 460
Contenido 11

Capítulo 14 Uniones p-n a niveles altos de corriente; 479


el rectificara p-i-n,
14.1 Uniones p-n a densidades altas de corriente, 479
14.2 El análisis del rectificador p+-i-n+ a niveles
altos de corriente, 481
14.3 Rectificadores p-i-u; la caída de voltaje en sentido directo
como una función de la temperatura, 490

Capítulo 1S Otros dispositivos semiconductores, 495

15.1 El efecto fotovoltaico p-n y las celdas fotovoltaicas de


unión p-n, 495
15.2 Otros dispositivos sensibles a la luz; fototransistores, detectores
de partículas y detectores infrarrojos, 502
15.3 Rectificadores controlados p-n-p-n, 503
15.4 Diodos túnel, 506
15.5 Transist~res de efecto de campo o unipolares, 509

CAPITULO 16 CONTACTOS METAL-SEMICONDUCTOR Y


SUPERFICIES DE SEMICONDUCTORES, 513
16.1 Contactos metal-semiconductor en equilibrio, 513
16.2 Rectificación por contacto metal-semiconductor, 517
16.3 Estados superficiales y rectificación independiente de las
funciones de trabajo, 5 20
16.4 Potencial, campo y carga en la capa superficial de un
semiconductor, 524
16.5 Conductividad superficial, efecto de campo y movilidad
superficial; propiedades de superficies de
semiconductores reales, 5 31

Apéndice a la función & dirac S3S

Apéndice b análisis tensorial 537

Indice de nombres 541

Indice de temas S43


CAPITUW 1
Redes cristali,-,m y
tipos de cristales

1.1 CONCEPTO DE ESTADO "SOLIDO"

Desde un punto de vista general, el término sólido se aplica a substancias


elásticas rígidas, es decir, a substancias que tienen un comportamiento elástico no
sólo cuando se les somete a fuerzas hidrostáticas, sino también a esfuerzos de ten-
sión y cortantes. Por supuesto, existen algunos materiales cuyo comportamiento es
tanto elástico como plástico o viscoso, de modo que esta clasificación no es del
todo rigurosa. No obstante, se adoptará como criterio de lo que es una substancia
sólida, reconociendo que existe un tipo de substancias que, al mismo tiempo, se
comporta como sólido y como fluido.
Los materiales que se pueden considerar como sólidos de acuerdo con esta
defmición, se dividen en dos categorías: los amorfos y los cristalinos. Entre las
substancias amorfas, los átomos o moléculas pueden estar enlazados con bastante
firmeza entre sí; pero poseen poca o ninguna regularidad o periodicidad geométrica,
en la forma en que los átomos están dispuestos o acomodados en el espacio. Estas
substancias son casi siempre viscoelásticas y se pueden considerar como líquidos
sobreenfriados. En la figura 1.1 se muestra una representación bidimensional de un
material amorfo.

•o •o •o •o• •o • • o• •o•
•o •o•o •o• o • o •
•o •o •o •o • •o • o o • o • o

•o • o •o •o • • • o •o••
•o •o •o •o• •o o o • •o
•o •o • • • • o• o o •
• o • o • oo • oo • •o • • •
o o o •o •
o •
• • • • • • • • • •
Cristalino Amorfo

Figura 1.1. Representación esquemática en dos dimensiones, que muestra la düerencia existente
entre el arreglo atómico de un sólido cristalino y otro amorfo.

13
14 H.edes cristalinos y tipos de cristales

Por otro lado, las substancias cristalinas se caracterizan por una periodicidad
perfecta (o casi perfecta) en su estructura atómica; esta regularidad de estructura
proporciona un cuadro conceptual muy simple de un cristal y facilita la tarea de
comprender y calcular sus propiedades físicas. Por esta razón, los sólidos cristalinos
se comprenden mejor físicamente que los sólidos y líquidos amorfos. En este libro,
el tema se restringirá principalmente a un estudio de las propiedades físicas de los
sólidos cristalinos perfectos o casi perfectos. En algunas ocasiones, la presencia de un
número relativamente pequeño de imperfecciones tales como átomos de impurezas,
vacíos en la red o dislocaciones, en un cristal periódico que sería perfecto a no ser
por esta circunstancia, puede producir cambios notables en el comportamiento físico
del material. Esta obra se ocupará también de ellos según la importancia que revistan
dichos efectos.
Por último, es necesario comprender que las muestras macroscópicas de sólidos
cristalinos tales como metales, cerámicas, sales iónicas, etc., no siempre se componen
de un solo cristal, sino que a menudo están formados por un conjunto o conglo-
merado de pequeñas unidades de cristal -cada una con diferente orientación de
cristal- separadas entre sí por "fronteras o límites de grano" que se pueden consi-
derar como regiones definidas de rupturas y dislocaciones reticulares muy grandes.
Principalmente se tratarán las propiedades de diferentes tipos de cristales individuales;
pero se intentará comprender la naturaleza de las fronteras o límites de granos y
sei'ialar las principales formas en que pueden influir en las propiedades físicas de las
muestras cristalinas macroscópicas.

1.2 CELDAS UNITARIAS Y REDES DE BRAVAIS

En la figura 1.2 se describe la estructura reticular de un cristal bidimensional


que se utilizará como ejemplo para explicar ciertos términos cristalográficos funda-
mentales. En relación con esta figura, se puede seleccionar el paralelogramo ABCD
como una celda unitaria de dicha estructura reticular o red, la cual está determinada
por los vectores base a y b. Todas las traslaciones del paralelogramo ABCD mediante
múltiplos enteros de los vectores a y b a lo largo de las direcciones a y b, darán
como resultado su traslación a una región del cristal exactamente igual a la original.
Así pues, todo el cristal se puede reproducir sencillamente si se reproduce la super-

Figura 1.2. Celdas unitarias y vectores base en una estructura reticular bidimensional.
Celdas unittuios y redes de Bravais 15

ficie ABCD que se traslada sobre las direcciones a y b mediante todas las combina-
ciones posibles de múltiplos de los vectores base a y b. En otras palabras, cada
punto de la red del cristal se puede describir por medio de un vector r tal que

r =ha+ kb, (1.2-1)

en donde h y k son enteros. Evidentemente, este procedimiento se puede ampliar


con suma facilidad para determinar celdas unitarias y vectores base en redes crista-
linas tridimensionales. Por tanto, se puede llegar a las siguientes defmiciones:

Celda unitaria: una región del cristal defmida por tres vectores, a, b y e, que
al trasladarse por medio de cualquier múltiplo entero de dichos vectores
reproduce una región similar del cristal,
Vectores base: conjunto de vectores linealmente independientes a, b, e, que se
pueden usar para defmir una celda unitaria,
Celda unitaria primitiva: la celda unitaria más pequeiia (en volumen) que se
puede defmir para una red dada,
Vectores base primitivos: conjunto de vectores linea1mente independientes que
definen una celda unitaria primitiva.

De acuerdo con las anteriores defmiciones, en este caso también es evidente que
cada punto reticular de una red cristalina tridimensional se puede describir mediante
un vector de la forma

r =ha+ kb +le (h, k, 1 enteros) (1.2-2)

Conviene obserYar que la celda unitaria se puede defmir de varias maneras, po1
ejemplo, A'B'C 'D' y A"B''C "D" son otras posibilidades que describen la celda uni·
taria ilustrada en la figura 1.2. Estas tres celdas unitarias son de tipo primitivo para
esta red y, por ende, existe una ambigüedad correspondiente en la selección de un
conjunto de vectores base primitivos. Cualquiera de los vectores (a, b) o (a', b')
podría servir de igual manera. La celda de mayor tamaño EFGH de la misma figura
es un ejemplo de una celda unitaria que no es primitiva.
Se puede demostrar que existen 14 formas de acomodar los puntos en las
redes cristalinas, de tal modo que todos los puntos de dichas redes tengan exacta-
mente el mismo medio circundante. Estas estructuras reticulares conocidas como
redes de Bravais se ilustran en la figura 1.3. En el caso de una de estas redes, un
observador que ve el cristal desde uno de los puntos de la red, vería exactamente la
misma disposición o arreglo de los puntos circundantes de la red, sea cual fuere el
punto que haya seleccionado para observar. A primera vista podría parecer que
puede existir otra red de Bravais; por ejemplo, en las 14 redes de Bravais de la
figura 1.3 no se incluye un arreglo tetragonal centrado en la cara. la razón de ello
es que esta estructura tetragonal centrada en la cara equivale a una red tetragonal
centrada en el cuerpo, en la que el lado de la base de la celda unitaria es 1/.¡2
veces su valor correspondiente a la disposición centrada en la cara. La demostración
de este postulado, y la pregunta acerca de por qué las estructuras cúbicas centrada
en la cara y centrada en el cuerpo son distintas, se le dejan al lector como ejercicio.
Estas 14 redes se pueden agrupar en siete sistemas cristalinos, cada uno de los
cuales tiene en común ciertos elementos de simetría característicos. Los elementos
de simetría que se han escogido para especificar estos siete sistemas son los si-
guientes:
16 Redes cristoliliiiS y tipos de cristales

/ /

/ V
Cúbica simple Cúbica centrada en la base Cúbica centrada en
la cara
./ 7

./ [7

Tetragonal simple Tetragonal centrada


en el cuerpo

V V
Ortorrómbica Ortorrómbica Ortorrómbica Ortorrómbica
simple centrada en la base centrada en el cuerpo centrada en la cara

MonocHnica Monoclínica Triclínica Trigonal


simple centrada en la base

Figura 1.3. Las catorce redes de Bravais.

(1) Eje de rotación de orden n: la rotación alrededor de un eje de este tipo a


un ángulo de 21rjn radianes no produce ningún cambio en la estructura
reticular. En este caso, n puede tener los valores 1, 2, 3, 4 y 6. La simetría
rotacional de 5 veces en una red cristalina es imposible.
(2) Plano de simetría: una mitad del cristal reflejada en un plano semejante
que pasa por un punto de la red, reproduce la otra mitad.
Celdas unitarias y redes de Bravais 17

(3) Centro de inversión: un punto de la red alrededor del cual la operación


r-+ - r (en donde r es un vector a cualquier otro punto de la red) deja a
la estructura reticular sin sufrir cambio alguno.
( 4) Eje de rotación-inversión: la rotación alrededor de este eje a 2n/n radianes
(n = 1, 2, 3, 4, 6) seguida de una inversión alrededor de un punto de la red
por el que pasa el eje de rotación, no produce ningún cambio en la red.

Existen otras formas posibles de operaciones de simetría; pero se puede demos-


trar que todas son equivalentes a combinaciones lineales de estas cuatro. Los siete
sistemas cristalinos con sus elementos de simetría representativos y sus características
de celda unitaria aparecen en la tabla 1.1. En la figura 1.4 se describe la notación
que se emplea para las dimensiones y los ángulos de la celda unitaria.

TABLA l.l
Los siete sistemas cristalinos

Elemento característico Red de Características de


Sistema de simetría* Bravais la celda unitaria

Triclínico Ninguno Simple

Monoclínico Un eje de rotación doble Simple a=l=b=l=c


Centrada en a. = f3 = 90° =1= y
la base
Ortorrómbico Tres ejes de rotación doble Simple a=l=b=l=c
mutuamente perpendiculares Centrada en a. = f3 = y = 900
la base
Centrada en
el cuerpo
Centrada en
la cara
Tetragonal Un eje de rotación cuádruple Simple a=b=l=c
o un eje de rotación-inversión Centrada en a. = f3 = y = 900
cuádruple el cuerpo
Cúbico Cuatro ejes de rotación triple Simple a=b=c
(diagonales cúbicas) Centrada en a. = f3 = y = 90°
el cuerpo
Centrada en
la cara
Hexagonal Un eje de rotación séxtuple Simple a =b =1= e
a.= 120°
f3 =y= 90°
Trigonal Un eje de rotación triple Simple a=b=c
(Rombohédrico) a. = f3 = Y -r 90·
*Por supuesto, pueden existir otras propiedades de simetría en casos individuales. aquí se
indican sólo los más peculiares de cada sistema cristalino en particular.
18 Redes cristalinas y tipos de cristales

~------b--------~

Figura 1.4. Notación de los ángulos y las dimensiones dentro de la celda unitaria.

Conviene recordar que, por lo general, los puntos de la red de una estructura
reticular no representan a un solo átomo, sino más bien a un grupo de átomos o
molécula. En consecuencia, además de las propiedades de simetría de los puntos
reticulares propiamente dichos, se necesita tomar en cuenta las propiedades de sime-
tría de las moléculas o grupos de átomos en cada punto reticular alrededor de los
puntos de red propiamente dichos, a fin de enumerar totalmente todas las estruc-
turas cristalinas posibles. Cuando esto se hace, se descubre que hay 230 patrones
repetitivos básicamente diferentes en los que los elementos se pueden acomodar para
formar posibles estructuras cristalinas. Las limitaciones de este libro no permiten
estudiar y enumerar todas estas posibilidades en detalle. Si el lector desea obtener
datos más detallados sobre este tema, convendrá que consulte una de las obras que
tratan sobre cristalografía y que se citan al final de este capítulo.

1.3 ALGUNAS ESTRUCTURAS CRIST AUNAS SIMPLES

De acuerdo con la figura 1.3, es evidente que existen tres redes cúbicas posi-
bles, es decir, la cúbica simple, la cúbica centrada en el cuerpo y la cúbica centrada
en la cara. La celda cúbica unitaria que se ilustra en la figura 1.3 como la red
cúbica simple, constituye también la celda unitaria primitiva, dado que contiene el
mínimo irreductible de un átomo por cada celda. Este resultado se obtiene obser-
vando que en la celda cúbica simple se tienen ocho átomos en los ocho vértices de
la celda, donde, cada átomo es compartido en la misma forma por ocho celdas
unitarias adyacentes a cada vértice. Por tanto, se puede decir que se tienen 8 átomos
en las esquinas y que 1/8 de cada uno de éstos pertenece a esta celda en particular,
dando un total de un átomo por celda unitaria. La celda cúbica correspondiente a la
estructura cúbica centrada en la cara, contiene 8 átomos en los vértices, compartidos
por 8 celdas y 6 átomos centrados en la cara, que son compartidos por dos celdas,
lo cual da un total de 8(1/8) + 6(1/2), o bien, 4 átomos dentro de la celda cúbica.
En la celda cúbica correspondiente a la estructura cúbica centrada en el cuerpo, se
tienen 8 átomos en los vértices compartidos por 8 celdas y un átomo central que
pertenece exclusivamente a dicha celda, dando un total de 8(1/8) + 1 ó 2 átomos
dentro de la celda cúbica. Para estructuras simples que contienen átomos de un solo
tipo, la celda unitaria primitiva contiene casi siempre un solo átomo y, por tanto, se
puede llegar a la conclusión de que la celda cúbica centrada en la cara y la centrada
en el cunpo no son primitivas. En efecto, este es el caso; las celdas primitivas para
las estructm:J<; cúhica crntrada en la cara y cúbica centrada en el cuerpo, se ilustran
Algunas estructuras cristalinas simples 19

Celda primitiva
cúbica centrada en la cara

1
Celda primitiva 1
cúbica centrada en el cuerpo 1
1
1 1 1
11 11
~--------4'
Figura 1.5. Celdas unitaria~ primitivas de redes cúbicas centrada en la cara y centrada en el
cuerpo.

en la figura l.S. Cada celda primitiva contiene un solo átomo. Como siempre, estas
celdas primitivas no son las únicas que se pueden definir, ya que existen muchas
opciones posibles de grupos de vectores base primitivos para cualquiera de las estruc-
turas.
La celda primitiva para la estructura cúbica centrada en la cara que se ilustra
en la figura 1.5 es, obviamente, un caso especial de una estructura trigonal en la
que a = {3 = 'Y = 60°. Para este valor particular de a, la estructura trigonal posee una
simetría cúbica y se reduce a la red cúbica centrada en la cara. Por supuesto, se
puede hacer caso omiso de la celda cúbica de la red cúbica centrada en la cara y
considerar que la estructura sea de tipo trigonal con a = 60°, empleando sólo la
celda primitiva de la figura l.S. Sin embargo, casi siempre conviene considerar la
mayor celda cúbica como la base del cristal, en lugar de utilizar la celda primitiva,
ya que esto permite representar la estructura reticular en un sistema de coordenadas
ortogonales (x, y, z) -el cual es mucho más simple que un sistema oblicuo- y porque
la red tiene todas las propiedades de simetría relacionadas con la estructura cúbica
simple. En el caso de la estructura cúbica centrada en el cuerpo, por similares
consideraciones, se aconseja usar, siempre que sP.a posible, la mayor celda cúbica
como la base del cristal. No obstante, para ciertos fines será absolutamente necesario
emplear la celda primitiva; pero estos casos especiales se señalarán cuando surjan.
Cuando se tienen esferas iguales dentro de un recipiente, el empaquetamiento
más cerrado o compacto que se puede lograr es tener una capa en la base en la que
cada esfera está rodeada por otras seis adyacentes, con capas exactamente iguales
encima de ella, utilizando los intersticios triangulares entre las esferas de la capa
inferior para acomodar las que se van agregando en la capa inmediatamente superior.
Es obvio que en un arreglo de empaquetamiento compacto cada esfera sólo tiene 12
vecinas adyacentes, seis que la rodean en la misma capa, 3 en la superior y. 3 en la
inferior. Cualquier estructura que tiene un empaquetamiento compacto en este sen-
tido, se caracteriza por la propiedad de que cada átomo tiene 12 vecinos adyacentes
y, por lo contrario, no hay otra estructura en la que cada átomo tenga más de 12
vecinos cercanos.
20 Redes cristalinos y tipos de cristales

@ Posiciones para la tercera capa en h.e.c.


© Posiciones para la tercera capa c.c.c. de empaquetamiento
en cúbica centrada en la cara compacto

Figura ] .6. Arre~( o de capas de empaquetamiento compacto en las redes cúbica centrada en la
eara con empaquct~miento compacto y la hexagonal con empaquetamiento com-
p;wto. [Tomado l"Oil autorización de L. V. Azaroff, Introduction to Solids, Mc-
C.raw-Hill (1960), pá¡>;ina 1)0.1
Algunas estructuras cristalinas simples 21

Para tener una estructura con esta clase de empaquetamiento compacto, se


puede colocar una capa inferior A, luego una segunda capa B -tal como se describió
en el párrafo anterior-, después se pone una tercera capa en la que los átomos
quedan directamente arriba de los de la capa A, a continuación, la cuarta capa
cuyos átomos se ubican directamente arriba de los de la capa B, y así sucesivamente
hasta formar un arreglo de capas ABABABAB ... , como se ilustra en la figura 1.6.
Esta estructura tiene una Simetría hexagonal y se le conoce con el nombre de
estructura hexagonal de empaquetamiento compacto (h.e.c.). De igual modo, se pue-
den colocar los átomos de la tercera capa ya no directamente encima de los de la
primera, sino en una tercera gama de posiciones como se ilustra en la figura 1.6,
formando la tercera capa C cuyos átomos quedan arriba, en una posición diferente a
los de las capas A y B. A continuación se agrega la cuarta capa en las posiciones
correspondientes a la capa A y se forma una disposición de capas ABCABCABC ...
Esta segunda estructura ·posible de empaquetamiento compacto es sencillamente, la
cúbica centrada en la cara, que es la normal en las capas de empaquetamiento
compacto de la estructura diagonal cúbica. De acuerdo con la figura 1.3, se puede
ver claramente que cada átomo de la estructura cúbica centrada en la cara tiene sólo
12 vecinos contiguos, a una distancia de ..j2(2 veces el lado del cubo, por lo que la
estructura debe ser de empaquetamiento compacto. Por el contrario, en la estructura
cúbica centrada en el cuerpo, cada átomo tiene sólo 8 vecinos adyacentes a una
distancia de ../'f/2 veces el lado del cubo; si los puntos reticulares de la estructura
cúbica centrada en el cuerpo se observaran como si fueran esferas en expansión,
éstas tocarían el borde del cubo antes de rozar la diagonal y la estructura resultante
no tendría un empaquetamiento tan compacto.
En la figura l. 7 se muestran las estructuras de NaCl y CsCI. La estructura del
NaCI tiene átomos alternantes de Na y Cl en los puntos reticulares de una red
cúbica simple. Los átomos de Na quedan en los puntos reticulares de una estructura
cúbica centrada en la cara, al igual que los átomos de Cl. La estructura del CsCl es
básicamente centrada en el cuerpo y, en ella, los átomos de Cs quedan en las
posiciones centradas en el cuerpo y los de Cl en los vértices del cubo (o viceversa).
Hay un gran número de cristales iónicos que cristalizan en cualquiera de estas dos
formas reticulares.

/ / /
L / /

~ V V
~ V V

V V V
V V V
(O) NoCI (b) CsCI

Figura 1.7. Las estructuras de NaCI y CsCI.

En la figura 1.8 se ilustran las estructuras del diamante y la zincblenda. Las


líneas que conectan los átomos de estas estructuras representan los enlaces covalentes
de los pares de electrones que están dispuestos tctrahédricamente alrededor de cada
átomo. En estas dos estructuras, cada átomo tiene cuatro vecinos contiguos. En el
caso del diamante, la estructura se puede considerar como dos redes cúbicas centra·
das en la cara que se intercalan una en la otra, desplazándose entre sí a lo largo de
la diagonal del cubo en 1/4 de la longitud de dicha diagonal. Por tanto, la re.d tiene
22 Redes cristaliTUlS y tipos de cristales

{al Zincblenda {ZnS) { b) Diamante

Figura 1.8. Estructuras de la zincblenda y el diamante.

Figura 1.9. Diagrama de la estructura reticular de la zincblenda en donde se muestran los


contornos lk la n:lcla unitaria cúbica.
Planos cristalinos e índices de Miller 23

una simetría cúbica. La descripción anterior de la red del diamante se puede en-
tender mejor estudiando la figura 1.9 en donde se muestra cómo la red del diaman-
te se puede describir mediante una celda unitaria cúbica. El silicio, el germanio y el
estaño a- (gris) se cristalizan también en la estructura del diamante. La estructura de
la zincblenda está íntimamente relacionada con la del diamante. En el caso de la
zmcblenda, la estructura se puede representar como dos redes cúbicas centradas en
la cara que tienen una interpenetración, al igual que el diamante, excepto que una de
las redes cúbicas centradas en la cara se compone por completo de átomos de zinc y
la obra está constituida totalmente por átomos de S. Por supuesto, esta estructura
reticular también tiene simetría cúbica. Los compuestos semiconductores III-V,
InSb, GaAs, GaSb, InP, GaP, etc., se cristalizan con esta misma estructura.
Lo "compacto" del empaquetamiento de los átomos en cualquier estructura
dada se puede inferir del número de vecinos más cercanos que rodean a cada átomo.
Esta cifra, que con frecuencia se denomina número de coordinación del cristal,
puede variar de un máximo de 12 en las estructuras de empaquetamiento compacto
hasta el 4, en el caso del diamante y la zincblenda, cuyas estructuras son relativa-
mente "abiertas".

1.4 PLANOS CRISTALINOS E INDICES DE MILLER

En un cristal de red periódica regular, con frecuencia es necesario mencionar el


sistema de planos dentro del cristal que corren en ciertas direcciones, cortando varios
conjuntos de átomos. Así pues, las capas con empaquetamiento compacto de las
redes cúbicas centradas en la cara y hexagonal con empaquetamiento compacto,
forman sistemas muy definidos e importantes de planos cristalinos. La orientación de
estos sistemas de planos dentro del cristal se especifica mediante tres números deno-
minados índices de Miller, que se pueden determinar como sigue:

(1) Se toma como origen cualquier átomo del cristal y se levantan ejes de
coordenadas a partir de dicho átomo en las direcciones de los vectores
base.
(2) Se encuentran las intersecciones de un plano que pertenece al sistema,
expresándolos como múltiplos enteros de los vectores base a lo largo de
los ejes cristalinos.
(3) Se sacan los recíprocos de estos números y se reducen a la tríada más
pequeña de enteros h, k, l, que tienen la misma relación. De donde, la
cantidad (hk/) constituye lol> índices de Miller de dicho sistema de planos.

Por ejemplo, en la figura 1.1 O se muestra un plano cuyas intersecciones son el


doble de la distancia reticular a, tres veces la distancia reticular b y 4 veces la
distancia reticular c. Los índices de Miller de la familia a la que pertenece este
plano se obtienen sacando los recíprocos de estos números, es decir, 1/2, 1/3, 1/4, y
reduciéndolos a la tríada más pequeña posible de enteros que tengan la misma
relación. Esto se logra multiplicando cada uno de los recíprocos p0r doce, que en
este caso dan 6, 4, 3. Los índices de Miller se escriben simplemente encerrando estos
tres números entre paréntesis; en este ejemplo, el plano forma parte de una familia
de planos (643) o sea, un plano.
Puede haber un número de sistemas de planos cuyos índices de Miller difieran
por permutación de los números o de signos menos y, sin embargo, ser todos
cristalográficantente equivalentes en lo que respecta a densidad de átomos y espa-
24 Redes cristalinas y tipos de cristales

Figura 1.10. Un plano reticular (643) de una red cristalina.

ciamiento interplanar. Por ejemplo, en una red ortogonal, los siguientes planos
(Jzkl), (hkl), (hKl), (hkl), (ftld), (fikl), etc., obtenidos al asignar varias combinaciones de
signos menos a los índices de Miller, son equivalentes en este sentido. (Se acostum-
bra escribir los signos menos encima y no antes de los índices de Miller.) De igual
modo, en una estructura reticular cúbica, todos los planos representados por permu-
taciones de los tres índices de Miller entre sí mismos, tales como (hkl), (khl), (lhk),
etcétera, al igual que los que se obtienen tomando varias combinaciones de signos me-
nos, son cristalográficamente equivalentes. C'uando se hace referencia a un grupo
completo de planos cristalográficamente equivall'ntes, de los cuales (hkl) ~s un miem-
bro, se acostumbra encerrar los índices de Miller entre llaves, o sea, { hkl}.
Si el plano es paralelo a uno o dos de Jos vectores a, b, e, una o dos de las
intersecciones se localizarán en el infinito; los índices de Miller correspondientes son,
por tanto. cero. Por ejemplo, si el plano que se ilustra en la figura 1.1 O se hace
girar alrededor de la línea AB hasta que queda paralelo a e, las intersecciones se
convierten en 2, 3, oo, y los índices de Miller son, en consecuencia (320). Si se hace
girar más todavía alrededor de una línea perpendicular al plano a y b pasando por
el punto A hasta que quede en paralelo a b, las intersecciones serán 2, oo, uo, y los
índices de Miller son (1 00). El lector debe conocer a fondo las familias de planos
{ 100} (planos de cara cúbica), { 11 O } y de {111} para las redes cúbicas.
Los índices de una dirección dentro de un cri~tal se pueden expresar como un
conjunto de enteros que tienen la misma relación que los componentes de un vector
en esa dirección, expresados como múltiplos de los vectores base a, b, c. Por tanto,
el índice de dirección de un vector ha+ kb +le es, en todo caso, [hkl]. Los parén-
tesis cuadrados que encierran las tres cifras señalan los tres índices de dirección. Por
supuesto, las direcciones con distintos índices direccionales pueden ser cristalográ-
ficamente diferentes en la misma forma que los planos cristalinos con distintos
índices de Miller; sobre todo las normales a los planos cristalográficamente equiva-
lentes también deben tener direcciones cristalográficamente equivalentes. El conjunto
completo de direcciones cristalográficamente equivalentes de las cuales [hkll es un
miembro, se expresa encerrando los índices de dirección en la siguiente forma: (hk[).
En cristales cúbicos, una dirección con índices direccionales [hkl] es normal a un
plano cuyos índices de Miller son (hkl); pero, por lo general, esto no se aplica a
otros sistemas. Esta es otra de las razones aceptables para relacionar las redes cúbicas
centradas en el cuerpo y la centrada en la cara con estructuras cúbicas más que con
celdas unitarias primitivas. El comprobar este resultado queda como ejercicio para el
lector.
La posición de los puntos de una celda unitaria se especifica en función de las
partes fraccionales de las magn1tudes de los vectores de base a lo largu de las
direcciOne~ de coordenadas correspondientes, tomando siempre como origen el átomo
Espaciamiento de los planos en las redes cristalinas 25

de un vértice. Por ejemplo, las coordenadas del punto central de una celda unitaria
son {1/2, 1/2, 1/2) y las coordenadas de los centros de las caras son (1/2, 1/2,
0), (0, 1/2, 1/2), (1/2, O, 1/2), (1/2, 1/2, 1), (1, 1/2, 1/2) y (1/2, 1, 1/2).

1.5 ESPACIAMIENTO DE LOS PLANOS EN LAS REDES CRISTALINAS

De acuerdo con la figura 1.1 O, se podría pensar que el espaciamiento existente


entre los planos vecinos del sistema (hkl) sería simplemente igual a la longitud de la
normal al plano definida por las intersecciones dadas y el origen. Sin embargo,
generalmente no es así y la razón es que al determinar la ubicación de un plano
(hkl) desde ciertas distancias de intersección, el origen se podría tomar como cual-
quier punto reticular del cristal, por lo que un plano (hkl) debe pasar por cada
punto reticular del cristal. Esto se ilustra gráficamente en la figura 1.11 para el caso
de un conjunto de "planos" en una estructura reticular bidimensional. El sistema de
planos es el que determinan las intersecciones 3a y 2b a lo largo de los ejes, a y b,
respectivamente. En consecuencia, los índices de Miller son (23) (o bien, (230) si se
piensa que los planos son paralelos a un eje e que sale del plano de la hoja de papel
en un cristal tridimensional). Los planos que están delineados con líneas más gruesas
son los que se determinan por medio de las distancias de intersección (3a, 2b) y el
origen se escoge en O. No obstante, el origen podría haberse escogido en el punto
reticular número "1 ", en cuyo caso se habrían definido los planos de trazo más
ligero marcados con "1 ", utilizando el mismo conjunto de distancias de intersección.
De igual manera, el origen se podría haber ubicado en los puntos reticulares 2, 3, 4
ó 5, en cuyo caso, usando todavía el mismo conjunto de distancias de intersección,
el conjunto de planos números 2, 3, 4 y 5 habrían quedado definidos. Sin embargo,
ahora se tiene un plano de esta familia que pasa por cada átomo del cristal, entre

Figura I.l L Una representación de todas las líneas (23) dentro de una red bidimensional.
Si existe un eie e- normal al nlano del papel, este sistema de líneas se puede consi-
derar como los tra10s de planos (230) (que son normales a la página) en el plano
del papel. Observe que sólo se tiene una línea (o plano) del sistema que pasa pnr
cada punto reticular.
26 Redes cristalinos y tipos de cristales

los cuales se intercalan 5 planos adicionales entre cada par de planos originales de
trazo grueso. Ahora se ve que las intersecciones de los planos adyacentes a lo largo
de los ejes a y b difieren, respectivamente, en a/2 y b/3. Para un .conjunto de ín-
dices de Miller (hk) estas intersecciones diferirán en a/h y b/k.
Para demostrarlo, véase primero el área OA CB de la figura 1.11. Se tienen los
puntos reticulares hk que pertenecen a esta área, ya que consiste en hk celdas
unitarias que tienen cada una de ellas un solo punto reticular. La región ABCD, que
obviamente equivale en superficie a OACB (ambas se pueden tomar como superposi-
ciones de dos triángulos congruentes a OAB) por tanto, también tiene hk puntos
reticulares. Esta superficie también contiene sólo hk planos reticulares (6 en el ejem-
plo anterior), uno por cada uno de los puntos reticulares hk dentro del área. Se
observará que cada plano puede cortar sólo un punto reticular dentro de ABCD,
excepción hecha de los planos que cortan los puntos reticulares de las fronteras, que
pueden pasar por dos puntos reticulares, de los cuales un medio o un cuarto pueden
pertenecer a ABCD, dependiendo de que dichos puntos reticulares así intersecados
representen átomos laterales o de vértices. En consecuencia, en ABCD hay hk planos
del sistema que se intersecan con el eje b dentro de una distancia hb, siendo la
diferencia que hay entre las intersecciones b de los planos adyacentes, hb/hk = b/k.
De la misma manera, en el área ABEC que también es igual en superficie a OACB y
que contiene también hk puntos reticulares y hk planos, se observa que se tienen hk
que cortan el eje a en una distancia ka, en donde la diferencia existente entre las in-
tersecciones a de los planos adyacentes del sistema es afh. Para simplificar los conceptos
geométricos, este resultado se obtuvo para un cristal bidimensional (o para planos
paralelos al eje e de un cristal tridimensional). Sin embargo este mismo argumento se
puede ampliar en una forma muy directa para un conjunto de planos (hk{) de un
cristal tridimensional teniendo como resultado el hecho de que las distancias entre
las intersecciones entre los ejes y los planos adyacentes de un sistema con índices de
Miller (hkl) a lo largo de los ejes a-, b- y e- son, respectivamente, afh, b/k y cfl.
El desarrollo de la exposición para un cristal tridimensional queda de ejercicio para
que el lector lo resuelva.
El espaciamiento real d que hay entre los planos adyacentes se puede calcular
tomando cualquier punto reticular como origen, levantando ejes en las direcciones

b
k

Figura 1.12. Angulas direccionales de la normal al plano (hkl).


Qasificación general de ~os cristales 27

a-, b- y e-, y encontrando la distancia perpendicular existente· entre este origen y


el plano cuyas intersecciones con el eje son afh, b/k y cfl. En relación con la fi-
gura 1.12, es obvio que

a b e
d = OP = h cos rx = k cos fJ = l cos y, (1.5-1)

en donde a, {3, 'Y son los ángulos que hay entre la nonnal al plano y los ejes a-, b-
Y e-, respectivamente. No obstante, si n es el vector unitario nonnal al plano, se
tiene que n • a =a cosa, etc., y

n·a n·b n·c


d=-=-=- (1.5-2)
h k l .

En una red ortogonal, tomando el eje de la coordenada x a lo largo de a, el


eje y sobre b y el eje z sobre e, la ecuación del plano (hkl) cuyas intersecciones con los
ejes son a/h, b/k, cfl, es

hx ky lz
f(x,y,z) =-; + b +e = l. (1.5-3)

Si f(x, y, z) =constante es la ecuación de una superficie, entonces Vf es un


vector nonnal a dicha superficie y la unidad nonnal n está dada por

Vf (hfa)i" + (k/b)i, + (lfc)iz (1.5-4)


0 = \-Vf-1 = "'--"-........;;;J'":-h-2..;. . .;. . . ;k2-<--l....:.2.;.....;....=.,
2+b2+2
a e

y el espaciamiento d'que hay entre los planos adyacentes (hkl) es simplemente


n·a 1
d= - = , (1.5-5)
h Jh2 k2 [2
2+b2+2
a e

de acuerdo con (1.5-2). En este punto conviene observar que a, b y e no son


vectores unitarios, en este ejemplo, a = aix, b = biy y e = ciz, en donde ix, iy e iz
son la tríada usual de vectores unitarios a lo largo de las direcciones x-, y- y z-,
respectivamente. En estructuras reticulares no ortogonales, el problema de encontrar
el espaciamiento existente entre planos adyacentes en ténninos explícitos de los
espaciamientos y los ángulos reticulares se hace más complejo y no se estudiará en
esta obra, aunque las expresiones generales (1.5-1) y (1.5-2) son correctas tanto para
sistemas ortogonales como para los no ortogonales.

1.6 CLASIFICACION GENERAL DE LOS CRISTALES

Para darle al lector una imagen inicial amplia de las propiedades y las caracterís-
ticas de varios tipos de materiah:s cristalinos, se hará un repaso breve de algunas de las
características más sobresalientes de varias clases de cristales. Por supuesto, se pueden
28 Redes cristalinas y tipos de cristales

clasificar en muchas formas, por ejemplo, según sus redes cristalinas, propiedades
eléctricas, propiedades mecánicas o características químicas. Sin embargo, para el
estudio que nos ocupa, es más conveniente adoptar un esquema de clasificación
basado en el tipo de interacción que hace que los átomos del cristal se mantengan
unidos. De acuerdo con este esquema de clasificación, los sólidos se subdividen en
cuatro categorías generales: iónicos, covalentes, metálicos y moleculares. Cada una de
estas clases se examinará en lo particular, aunque se reconoce que no son absoluta-
mente distintos y que algunos cristales pueden posser, al mismo tiempo, caracte-
rísticas relacionadas con más de una de estas clases generales.
Los iónicos son cristales en los que los electrones de valencia se transfieren de
un átomo a otro, dando como resultado que el cristal esté compuesto de iones
positivos y negativos. La fuente de energía cohesiva que mantiene unido al cristal es
la intersección electrostática de estos iones. La configuración electrónica de los iones
es esencialmente la de un gas inerte, en donde la distribución de carga de cada ion
es esféricamente simétrica. Los compuestos químicos que contienen átomos muy
electropositivos y electronegativos, por ejemplo, NaCl, KBr, LiF, tienden a formar
cristales iónicos en estado sólido. Casi siempre los cristales iónicos tienen energías de
enlace relativamente altas y, como resultado, se caracterizan por puntos de fusión y
ebullición más o menos elevado. También se caracterizan por ser malos conductores
eléctricos a temperaturas normales y casi siempre son transparentes a la luz visible
en tanto que muestran un solo pico de reflexión óptico característico en la región
lejana infrarroja del espectro. Los cristales son a menudo muy solubles en disolventes
ionizantes tales como el agua, y sus soluciones se disocian fácilmente en iones libres.
Casi siempre los cristales iónicos se cristalizan en estructuras de empaquetamiento
relativamente compacto como las del NaCl y el CsCI.
Los cristales covalentes son aquellos en los que varios átomos comparten equi-
tativamente los electrones de valencia en lugar de transferirlos de unos a otros, como
sucede en los cristales iónicos. De donde, no se tiene una carga neta asociada con
ningún átomo del cristal. A menudo los elementos de las columnas III, IV y V de la
tabla periódica forman combinaciones covalentes. Un ejemplo típico de cristal cava-
lente lo tenemos en el diamante, en el que cada átomo de carbono comparte sus
cuatro electrones de valencia con sus cuatro vecinos más cercanos formando enlaces
covalentes de pares de electrones. Los espins de los electrones de estos enlaces de
par de electrones son antiparalelos. Estos enlaces covalentes de pares de electrones
del diamante son idénticos a las uniones carbono-carbono que se encuentran tan
frecuentemente en los compuestos orgánicos. Tienen una naturaleza muy direccional,
es decir, los electrones tienden a concentrarse a lo largo de las líneas que unen a los
átomos adyacentes y estas líneas tienden a ubicarse tetrahédricamente alrededor de
cualquier átomo. Esta disposición tetrahédrica natural de los enlaces covalentes se
satisface en las estructuras del diamante y la zincblenda y se ha descubierto que los
cristales covalentes tienen a menudo estas estructuras. Por lo general, los cristales
covalentes son materiales duros, quebradizos y de energías de enlace bastante eleva-
das, con puntos de fusión y ebullición elevados. Son semiconductores típicos cuya
conductividad eléctrica es muy sensible a la presencia de pequeñas cantidades de
átomos de impurezas y aumenta al incrementarse la temperatura a niveles lo suficien-
temente elevados. Son transparentes a la radiación de longitudes de onda largas y
opacos a longitudes de onda más cortas, con una transición abrupta que se produce
a una longitud de onda característica y que casi siempre se localiza en la región
visible o infrarroja cercana.
Existe un rango continuo entre las propiedades covalente e iónica; un cristal
dado puede tener naturaleza tanto covalente como iónica y sus electrones de va-
lencia se transfieren en parte y se comparten parcialmente. En la tabla 1.2, los
cmtales de la primera columna se componen de átomos de la columna IV del
Dosificación general de los cristales 29

TABLA 1.2.
Cristales covalentes y iónicos

Compuestos Compuestos Compuestos


Covalentes III-V 11-VI {iónicos)
(Grupo IV) I-VII

e (diamante) BN BeO LiF


BP BeS LiCI
AIN MgO NaF
SI AIP MgS NaCI
GaP CaO KF
AlAs Ca S KCI
ZnS LiBr
Ge GaAs CaSe KBr
InP ZnSe Nal
AISb CdS RbCI
GaSb CdSe RbBr
InAs ZnTe KF
cx-Sn InSb CdTe Rbl
CsBr

sistema periódico y forman cristales completamente covalentes. Los compuestos de la


cuarta columna de la tabla son de '"I y VII" y están constituidos de átomos muy
electropositivos y electronegativos y los cristales de estos compuestos son muy ióni-
cos. La segunda y la tercera columnas contienen compuestos (II-Vl y lll-V) que son
intermedios entre estos dos extremos y tienen naturaleza tanto iónica como cava-
lente. Por supuesto, los compuestos 111-V son un poco más covalentes que los com-
puestos 11-VI. Los compuestos intermetálicos III-V forman, a pesar de su carácter
ligeramente iónico, una serie de semiconductores cuyas propiedades son similares en
muchas formas a las de Jos materiales correspondientes del grupo IV.
Los elementos metálicos en estado libre forman cristales metálicos en los que
están presentes electrones libres. El hecho de que haya tales electrones libres explica
la elevada conductividad eléctrica y térmica de los metales. A su vez, a esta elevada
conductividad eléctrica se deben directamente los elevados coeficientes de reflexión y
absorción ópticas que son las propiedades ópticas más típicas de los metales. Las
propiedades eléctricas y térmicas de los metales que se deben a la existencia de los
electrones libres, se pueden explicar fácilmente si se supone que el cristal metálico es
un recipiente lleno de un "gas ideal de electrones libres". La energía de enlace de
metales "ideales" tales como los metales alcalinos, se originan en la interacción del
gas de electrones libres con iones positivos de la red, aunque para muchos otros
metales esta imagen es mucho más compleja. Las energías de enlace reales de los
cristales metálicos pueden ser muy bajas, como sucede en el caso de los metales
alcalinos, que tienen puntos de ebullición y fusión relativamente bajos o muy eleva-
dos, como el tungsteno. cuyo punto de fusión es muy alto.
Los cristales moleculares son aquellos en los que el enlace entre átomos o las
moléculas no es iónico ni covalente, sino que se origina exclusivamente en fuerzas
dipolares existentes entre los átomos o las moléculas del cristal. A pesar de que un
átomo o una molécula no tiene un momento dipolar promedio, por lo general tendrá
un momento dipolar instantáneo y fluctuante que se origina en las posiciones instantá-
30 Redes cristalinas y tipos de cristales

neas de los electrones dentro de sus órbitas. Este momento dipolar instantáneo
es la fuente de un campo dipolar electrostático que, a su vez, puede inducir un mo-
mento dipolar en otro átomo u otra molécula. La interacción existente entre el mo-
mento dipolar original y el inducido es de atracción y puede servir para unir un
cristal en ausencia de un enlace de tipo iónico y covalente. Las fuerzas de enlace
que se originan en interacciones dipolares fluctuantes de esta naturaleza se conocen
con el nombre de fuerzas de van der Waals. Casi siempre, estas fuerzas son muy
débiles y la energía de enlace que originan disminuye según l/r6 , en donde r es la
distancia entre los dipolos. Entonces, los cristales moleculares se caracterizan por
energías de enlace reducidas y, en consecuencia, por puntos de fusión y ebullición
bajos; por lo general son conductores eléctricos deficientes. Los cristales de com-
puestos orgánicos generalmente pertenecen a esta clase, como es el caso' de los gases
inertes He, Ne, A, etc., en estado sólido.

EJERCICIOS

l. Demuestre geométricamente que la estructura tetragonal centrada en la cara es equiva-


lente a una red tetragonal centrada en el cuerpo en la que el lado de la base de la celda unitaria
es 1/.,¡2 veces la magnitud que tiene para la disposición centrada en la cara. ¿Por qué son
distintas las estructuras cúbicas centrada en la cara y la centrada en el cuerpo?
2. Demuestre que la proporción máxima de espacio que se puede llenar con esferas sólidas
acomodadas en varias estructuras es la siguiente para cada arreglo

Cúbica simple 7T/6,


Cúbica centrada en el cuerpo 7Tv' 3/8,
Cúbica centrada en la cara 7Tv'1¡6,
Hexagonal con empaquetamiento compacto 7Tv'2/6,
Estructura del diamante 7Tv'3!t6.

3. Analice desde el punto de vista físico el porqué un cristal real no puede tener un eje
de un múltiplo de cinco de simetría rotativa.
4. (a) Dibuje los bosquejos que ilustren Jos planos (100), (110) y (111) para una celda
unitaria cúbica. •
(b) ¿Cuántos planos equivalentes {lOO'}, ( 110} y { 111} existen en un cristal cúbico?
Considere que los planos (hkl) y (hkl) son idénticos.
5. (a) ¿Cuántos planos equivalentes {123} existen en un cristal cúbico?
(b) ¿Cuántos planos equivalentes { 111} existen en un cristal ortorrómbico?
(e) ¿Cuántos planos equivalentes { 123} existen en un cristal ortorrómbico? En todos
estos casos se considerará que los planos (hkl) y (hkl) son idénticos.
6. Demuestre que en un cristal cúbico la dirección [hkl] es normal al plano (hkl).
7. Demuestre que las intersecciones entre los ejes y Jos planos adyacentes (hkl) a Jo largo
de los ejes, a-, b- y e- dentro de una estructura tridimensional son a/h, b/k y e/1, respectiva-
mente, utilizando una extensión de los métodos que se usaron en el caso bidimensional dt' la
sección 1.5.
8. Demuestre que para las fuerzas de van der Waals, la energía de interacción de los
átomos y las moléculas desciende en la forma lfr6, en donde r es la distancia que hay entre
los átomos o las moléculas interactuantes. Nota: principie teniendo en cuenta la energía potencial
de un dipolo eléctrico en un campo eléctrico externo.
9. De acuerdo con los resultados de la teoría electromagnética de Maxwell para ondas
planas, demuestre que en el caso de un conductor muy bueno (a~oo, K ~oo, a= conductividad,
K =constante dieléctrica) se debe esperar un alto grado de reflectividad superficial y una gran
absorción interna.
CAPITULO 2
Análisis cristalográfico
con rayos X

1.1 INTRODUCCION

El uso de la difracción de los rayos X como técnica para analizar la estructura


de los cristales, data del descubrimiento de los efectos de difracción de los rayos X
en muestras de un monocristal, efectuado por von Laue en 1912. Laue predijo que
:0s átomos de un espécimen monocristalino producirían la difracción de un haz de
::o~ os X monocromático y paralelo, originando una serie de haces difractados cuyas
.:!necciones e intensidades dependerían de la estructura reticular y la composición
":.~ímica del cristal. Estas predicciones se verificaron en un plazo muy corto, gracias
1 los trabajos de Friedrich y Knipping. En la figura 2.l(a) se muestra un diagrama
esquemático del arreglo experimental correspondiente. La ubicación de los máximos de
difracción fue explicada por W. L. Bragg, 1 a base de un modelo muy simple en el que
;.e supone que la radiación X se refleja especularmente desde los planos sucesivos de los

fi!~Jra 2.1. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica de
Laue.

1 W.L. Bragg, Proc. Cambrige Phil. Soc. 17, 43 0912).

31
32 Análisis cristalográfico con rayos X

Figura 2.1. (continúa) (b) Un patrón de difracción de Laue de un cristal de fluoruro de litio,
haz incidente de rayos X a lo largo de una dirección { 100} (fotografía por cor-
tesía de H. A. McKinstry, Materials Research Laboratory, Pennsylvania Sta te Uni-
versity).

471"
~~--~~----~~L-~~--~~~----~~----~671"

Planos
del cristal

AB = AC =d sen 8

Figura 2.2. Representación de Bragg de una difracción de rayos X, de acuerdo con reflexion.:s
en fase desde planos sucesivos de un sistema particular (hk/).
Introducción 33

diversos sistemas (hkl) del cristal, y en el que los máximos de difracción sólo se encuen-
tran para direcciones de incidencia y reflexión tales que las reflexiones de los planos
adyacentes de un sistema interfieran en forma constructiva, con diferencias de fase de
2rrn radianes, en donde n es un entero.
Según este experimento, la diferencia de trayectoria para reflexiones sucesivas
sería igual a un número entero de longitudes de onda de los rayos X. Sin embargo,
esta diferencia de trayectoria, de acuerdo con la figura 2.2, es 2d sen e, en donde d
es el espaciamiento entre planos átomicos adyacentes, tal y como lo dan las expre-
siones (1.5-2) o (1.5-5) y e es el ángulo de incidencia entre el plano atómico y el
haz incidente. Por tanto, los haces fuertemente difractados deben propagarse, fuera
del cristal, en direcciones para las que se satisface la ecuación de Bragg

nA.= 2d sen e (2.1-1)

A partir de 1916, la observación experimental de los patrones de difracción de


rayos X se simplificó enormemente gracias a la introducción del método de potencia
de Debye y Scherrer. 2 Como se ilustra en la figura 2.3(a), en este método se deja
pasar un haz monocromático paralelo lit> rayos X a través de un espécimen fina-
mente pulverizado. En forma puramente accidental, algunos de los microcristales del
espécimen pulverizado estarán orientados en el ángulo correcto de difracción para un
conjunto particular de planos (hkl), como se expresa en (2.1-1) y el haz difractado

' ' 1

.
'
\'
.
. )\ ;
¡

(b)

Figura 2.3. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica del
polvo de Debye-Scherrer. (b) Un patrón de difracción de polvo, de Debye-Scherrer
a partir de una muestra de un óxido compleJO de escandia y circonio (fotografía
por cortesía de H. A. l\lcKimtry, Materials Research Laboratory, Pennsylvania State
University).

2 P. Debye y P. Scherrer, Physikal, Zeitschr. 17, 277 (1916).


34 Análisis cristalográfico con rayos X

se produce inmediatamente. Puesto que la condición de difracción se puede satisfacer


para cualquier orientación angular posible </> de la normal a los planos de dispersión
alrededor del eje del haz incidente, y dado que siempre habrá microcristales orien-
tados en tal forma que produzcan la difracción (hkf) para cualquier valor de </>, el
haz difractado tendrá la forma de un cono cuyo ángulo de abertura es e y no sólo
un haz de rayos. Se acostumbra colocar una tira de película en la pared interior
de una cámara cilíndrica, concéntrica con la muestra, con el fin de interceptar una
porción específica de estos conos de difracción, que son una serie de arcos produ-
cidos sobre dicha película. En la figura 2.3(b) se ilustra un patrón pulverizado
logrado mediante este sistema.

2.2 FISICA DE LA DIFRACCION DE LOS RAYOS X:


LAS ECUACIONES DE VON LAUE

Los rayos X se pueden producir fácilmente permitiendo que electrones de alta


energía choquen contra un ánodo metálico que constituye el blanco. Los rayos X
producidos en esta forma poseen, además de un espectro de fondo continuo, algunas
líneas espectrales muy intensas y casi monocromáticas cuya frecuencia es caracte-
rística del material del blanco. Estas líneas se originan debido al paso de electrones
de capas internas del átomo a estados de mayor energía de los cuales se apartan
para volver al estado base original con la consecuente emisión de rayos X. La
producción de rayos X debido a la interacción de electrones de alta energía con la
materia se analiza más detalladamente en la obra de Leighton. 3
Si existe un potencial V0 entre el cátodo y el ánodo de un tubo de rayos X,
los electrones adquieren una energía eV0 -en donde e es la magnitud de la carga
electrónica- al llegar al ánodo. El cuanto de rayos X más energético que pueden
producir tales electrones es aquel para el que la energía del cuanto hv es igual a
eV0 • En consecuencia, para este cuanto,

eV0 = hv =he/A., (2.2-1)

en donde h( = 6.62 x 10- 27 erg-seg) es la constante de Planck. De donde, la longitud


de onda de rayos X más corta que se puede producir es

A.=~
l/ . (2.2-2)
e o

Para un voltaje de 10 kilovolts, esto demuestra que la longitud de onda mínima


de rayos X que se puede excitar es 1.24 x I0- 8 cm o sea, 1.24 unidades Angstrom.
Esta magnitud es del orden de las distancias interatómicas de cristales reales y, de acuer-
do con la ecuación de Bragg (2.1-1), es la apropiada para producir efectos de difracción
observables sin recurrir a valores extremos de d y e. Por tanto, en un tubo de rayos X
en el que los electrones se aceleran mediante un potencial de unas cuantas decenas de
kilovolts, se puede considerar satisfactorio para producir rayos X apropiados para el
trabajo de difracción cristalográfica.

3 R B. 1 ei¡•hton, l'rinl"iples o( Modern Physics, McGraw-Hill Book Co., Inc. Nueva York
(1959), p 405 d 21.
Física de la difracción de los rayos X 35

Cuando los átomos de un cristal están sometidos a una radiación electromag-


nética, por ejemplo, los rayos X, se ejercen sobre ellos fuerzas eléctricas debidas a la
interacción de las partículas cargadas de los átomos con el vector del campo eléc-
trico de la onda electromagnética. Debido a esto, los electrones atómicos vibran
armónicamente a la frecuencia de la radiación incidente sufriendo una aceleración.
Estas cargas aceleradas vuelven a irradiar energía electromagnética, de acuerdo con la
teoría electromagnética, a la frecuencia de vibración, es decir, a la de la onda
incidente. A las frecuencias de la luz visible en donde la longitud de onda incidente
es mucho mayor que las distancias interatómicas, la superposición de las ondas
reirradiadas o dispersas en esta forma por los átomos individuales del cristal, produce
solamente los efectos bien conocidos de la refracción y la reflexión ópticas. Sin
embargo, a las frecuencias de los rayos X, la longitud de onda incidente es compa-
rable al espaciamiento interatómico y se puede observar la difracción de la radiación
de los átomos del cristal.
Bragg supuso que los sistemas de planos cristalinos reflejarían especularmente
los rayos X, siempre y cuando se satisficiera la condición para la interferencia
constructiva entre las reflexiones de planos atómicos sucesivos. A continuación se
examinará en detalle la forma en que los rayos X dispersados de diferentes átomos
individuales se pueden recombinar de varias maneras. Primero se examinará la radia-
ción dispersada por dos centros de dispersión idénticos separados por una distancia r.
El vector n 0 se define como un vector unitario en la dirección del haz incidente y
se considera que el vector n 1 es un vector unitario en una dirección arbitraria de
dispersión, como se indica en la figura 2.4. Se supone que la radiación incidente es
un haz paralelo y el haz disperso se detecta en un punto de observación muy
distante. Por tanto la diferencia de trayectoria entre la radiación dispersa en P y la
que se dispersa en O es

PA - OB = r • n0 - r • n 1 = r • (n 0 - n 1 ). (2.2-3)

El vector n 0 - n 1 =N es la normal a lo que en la representación de Bragg se


denomina plano de reflexión, si n 1 fuera una dirección de difracción, como se
ilustra en la figura 2.5. De acuerdo con esta figura, también es evidente que la
magnitud de este vector es

N=2sen0. (2.2-4)

Figura 2.4. Geometría de la situación de dispersión de rayo~ X que ~e .mali1a en la ~cc­


ción 2.2.
36 Análisis cristalográfico con rayos X

/
/
/
/
/
/

Plano de
e_ _L_ di~ersión
Figura 2.5. Relación geométrica del haz incidente y el difractado, la normal de dispersión y el
"plano de dispersión".

La diferencia de fase rl>r entre la radiación dispersa en los dos puntos es, sen·
cillarnente 27T/A veces la diferencia de trayectoria, de donde,

(2.2-5)

Ahora bien, para que haya una difracción máxima en la dirección n cada áto-
mo del cristal debe contribuir a la dispersión en esa dirección, con una diferencia
de fase igual a un múltiplo entero de 27T radianes. Para que esto sea verdad, lo único
que se necesita es que la radiación de los átomos separados por los vectores reticu·
lares primitiJ;os a, b, y e se sumen en fase, ya que en este caso, la contribución de
otros átomos separados del origen por combinaciones enteras de estos vectores se
sumarán en fase obligatoriamente. Si las contribuciones de dispersión de átomos
circunvecinos tuviera una diferencia de fase distinta, siempre sería posible encontrar
un átomo del cristal que contribuyera con una radiación exacta de 1T radianes fuera
de fase con la contribución de un átomo dado; estas contribuciones se cancelarían
átomo por átomo, y no darían un haz difractado. Si se analiza un ejemplo en el
que átomos circunvecinos a lo largo de la dirección a contribuyen con componentes
de radiación en una dirección dada, que están fuera de fase en 1T radianes (o
7T/2, 7T/4, 7T/6, etc.,) se verá con claridad que esta afirmación es fácil de corroborar.
En consecuencia, lo único que se requiere es que se obtenga un múltiplo
entero de 27T (2.2-5), en donde r es igual a a, b o e, es decir, se requiere simultá·
neamente que

2n
-(a· N)= 2nh' = 2nnh
}.

2n
T (b • N) = 'J.nk' = 2nnk (2.2-6)

2n
-;-(e· N)= 2nl' = 2nnl.
l.

En estas expresiones, h', k', !' pueden ser cualquiera de tres enteros; en ge-
neral estos tres enteros pueden contener el factor común entero de mayor valor n
superior a la unidad, en cuyo caso se puede escribir h' = nh, k'= nk y !' = nl, en
Factor de dispersión atómica 37

donde h, k y 1 son ahora tres enteros en la misma relación que h', k' y 1 ' sólo que
no tienen un factor común mayor que la unidad. Si h', k', y 1 ', no tienen un factor
común mayor que la unidad, entonces se considera que n es la unidad. Si a,~. y 'Y
son los ángulos entre la normal de dispersión N y los ejes a-, b- y e- del cristal,
respectivamente, entonces, de acuerdo con (2.2-4), a • N= aN cosa= 2a sen() cosa,
etcétera, de donde (2.2-6) se puede expresar también como sigue

2a senO cos oc= h'A. = nh.A.,

2b sen (} cos fJ = k' A. = nk.A., (2.2-7)

2c sen (} cos y = l' A. = nl.A..

Estas expresiones se conocen con el nombre de ecuaciones de Laue. Para una


longitud de onda incidente dada, >.., y valores e~pecíficos de los enteros h, k, l y n,
las ecuaciones determinan un cierto valor de () y dos de las tres cantidades (cos a,
cos ~. cos 'Y). No obstante, sólo dos de las trc~ cantidades (a,~. 'Y) son independientes
debido a que una vez que se fijan los ángulos entre un vector y dos de los tres ejes
de coordenadas, la dirección del vector queda fija y el tercer ángulo se puede
determinar trigonométricarnente. Por ejemplo, en un sistema de coordenadas ortogo-
nales, un resultado elemental de geometría analítica es que cos2 a + cos2 ~ + cos 2 'Y =
l. Las tres ecuaciones (2.2-7) sirven, por tanto, para determinar un valor único de ()
y N, definiendo así una dirección de dispersión. Los cosenos de dirección de la
normal de dispersión N son, de acuerdo con la expresión (2.2-7), proporcionales a
h/a, k/b y 1/c. Sin embargo, los planos cercanos cuyos índices de Miller son (hkl), se
intersecan con los ejes a-, b- y e- a intervalos a/h, b/k y c/1; por tanto, los cosenos
de dirección de la normal a la familia de planos (hkl) son también proporcionales a
hja, k/b y ljc, de acuerdo con (1.5-1). La normal de dispersión N es, por ende,
idéntica a la normal de los planos (hkl) y, en consecuencia, los planos (hkl) pueden
tomarse como los de reflexión en la representación de Bragg.
Se puede demostrar que la ecuación de Bragg se sigue de las ecuaciones de
Laue, haciendo que h =a cos ajd, k= b cos ~/d, 1 =ecos 'Y/d, en la expresión (1.5-1),
de acuerdo con lo cual una de las tres ecuaciones de Laue se reduce a

nA.= 2d sen 8,

en donde d es la distancia entre los- planos adyacentes del sistema (hkl) y en donde
el orden n de la difracción es el factor común más alto entre los órdenes de
interferencia h', k' y l '. Por lo general, para referirse a una reflexión de rayos X
observada, se citan los números (h' k' 1 ') que dan el orden de interferencia entre los
átomos circunvecinos a lo largo de los ejes cristalinos; en consecuencia, el máximo
de difracción de primer orden para los planos ( 111) se menciona como la reflexión
(111), el máximo de difracción de segundo orden para el mismo conjunto de planos
(n = 2, h' = 2h, k' = 2k, 1' = 21) es la reflexión (222), el tercer orden es la reflexión
(333), etc.

2.3 FACTOR DE DISPERSION ATOMICA

Los cálculos de la sección anterior se basaron en la supostcton de que los


centros de los puntos de dispersión coincidían con los puntos reticulares. Ahora,
38 Análisis cristalográfico con rayos X

conviene tomar en cuenta que la dispersión, que es el resultado de una interacción


entre los electrones del átomo y un haz de rayos X, puede desarrollarse en cualquier
punto en que se encuentren los electrones. En otras palabras, se desea modificar los
cálculos considerando que la radiación X se dispersa debido a una distribución con-
tinua de "densidad de electrones" relacionada con cada punto reticular. Como se
verá más tarde, este concepto concuerda totalmente con el punto de vista de la
mecánica ondulatoria del proceso. Sin embargo, se debe hacer notar que se está
descuidando el efecto de dispersión de los núcleos atómicos que interactuán con
mucha menor fuerza con los rayos X. Se encontrará que, debido a la extensión
finita de la distribución de densidad e.lectrónica, la amplitud de la radiación difrac-
tada se multiplica por un factor que incluye la longitud de onda de los rayos X, el
ángulo incidente y la distribución de densidad electrónica asociada con los átomos.
Se principiará inquiriendo sobre la relación entre la amplitud de difracción de
los rayos X, en el ángulo de Bragg, dispersados por un elemento de carga p(r)dv,
ubicado en un elemento de volumen dv alrededor del punto r, y la que dispersa un
electrón de un solo punto en un punto de la red, como se ilustra en la figura 2.6.
En este caso, p(r) es la densidad de electrones, p(r) dv es la probabilidad de que se
encuentre un electrón dentro del elemento de volumen dv. Por supuesto, es necesrio
que

ip(r) dv = Z, (2.3-1)

en donde Z es el número de electrones por átomo, esto es, el número atómico de


los átomos de los que está compuesto el cristal. La integral anterior se toma sobre todo el
espacio; aunque al hacer los cálculos se supone habitualmente que las "nubes de elec-
trones", relacionadas con diferentes átomos del cristal, no se superponen en for-

Figura 2.6. Geometría de la situación de dispersión de rayos X que se analiza en la· sección 2.3.
Radiación dispersada en el ángulo ele Bragg por una densidad electrónica contenida
en el elemento de volumen dv en r, que se compara con la que se dispersaría des-
de un ciPctrón de punto en O.
Factor de dispersión atómica 39

ma apreciable, de donde, dicha nube electrónica de un solo átomo queda confmada


al volumen de una celda unitaria.
La diferencia de fase if>n entre la radiación dispersada en el origen y la que se
dispersa en el elemento dv en r es, de acuerdo con (2.2-5)
2n
cj>, = T (r • N). (2.3-2)

Si la amplitud de dispersión desde el electrón del punto a lo largo de la dirección


n 1 se representa mediante Aei(ks-wt), en donde k= 2n/A. y ses una coordenada de
distancia a lo largo de la dirección de dispersión n 1 , entonces, la amplitud de
dispersión a lo largo de tal dirección, a partir del elemento dv, será p(r)dv veces más
fuerte (puesto que será proporcional a la can ti dad de carga en ese elemento) y
estará fuera de fase en una cantidad dada por (2.3-2). La relación de la amplitud de
la radiación que dispersa el elemento dv con la que dispersa un electrón de punto
en el origen que se denominará df, será entonces

Aei(ks-wt)+i<i>,p(r) dv .
dr = . = pfr)é2n•fA.)(r·N) dv (2.3-3)
J Ae•<ks wt) ' ·

Si se integra sobre todo el espacio, se encontrará la relación f de la amplitud


dispersa en el átomo entero con la de un electrón de punto, en un punto reticular.
De donde,

f = 1 p(r)e(2ní/A.)(r·N) dv. (2.3-4)

No obstante, de acuerdo con la expres1ón (2.2-4)

2n 2n 4rr
T (r ·N)= T Nr cos 8' = T r sen() cos ()' = w cos ()', (2.3-5)

4rr
en donde 11 = "T sen 8. (2.3-6)

Si la densidad de carga del átomo es esféricamente simétrica y, por tanto, es


una función exclusiva de r, p(r) = p(r) y

f = f' J: J:n p(r)eiw cos 8 ' r 2 sen()' dr d()' dc/J. (2.3-7)

Se pueden evaluar las partes angulares de esta integral, integrando primera-


mente sobre Q>, luego sobre 8' (haciendo que x = cos 8', dx =sen O' d8'), y expre-
sando finalmente los factores exponenciales como funciones trigonométricas, lo cual da

f(!l) = l oo

o
sen 11r
4rrr 2 p(r) - - dr.
Jll"
(2.3-8)

Esta cantidad, es decir, la relación de la amplitud dispersada por el átomo real


con la que dispersa un solo electrón sobre un punto reticular, se denomina factor de
dispersión atómica. Puesto que 8 -+O, Jl-+ O y sen JlY/JlY-+ 1, de donde

Joj 4rrr p(r) dr = fp dv = Z,


00
!Ímf(tt) = 2
(2.3-9)
11~o v
40 Análisis cristalográfico con rayos X

Los valores de p(r) deben obtenerse, evaluando, de acuerdo con la mecamca


cuántica, las "funciones de onda" de los átomos del cristal. En un capítulo posterior
se verá en qué consiste este proceso. En la práctica, las funciones ondulatorias de los
átomos libres se utilizan muy a menudo en los cálculos del factor de dispersión,
para obtener resultados aproximados para las intensidades esperadas; mientras que las
funciones ondulatorias reales modificadas se emplean para los átomos, cuando éstos
se encuentran en una red cristalina.

2.4 FACTOR GEOMETRICO DE LA ESTRUCTURA

Hasta ahora, se ha supuesto que se trata de celdas unitarias con átomos exclu-
sivamente en los vértices (es decir, celdas unitarias primitivas). Si se desean predecir
las características de la radiación difractada desde cristales con celdas unitarias com-
plejas, que contienen más de un átomo, como sucede en las celdas cúbicas para las
estructuras cúbica centrada en el cuerpo y cúbica centrada en la cara, se debe
explicar la interacción de los haces que se difractan desde los diversos átomos,
dentro de la celda unitaria. Si para la reflexión (h' k'!') se representa la relación de
la amplitud de radiación que dispersa toda la celda unitaria en función a la que
dispersa un electrón de punto en el origen, por medio de F(h' k'!'), entonces

F(h'k'l') = ¿¡;ei4>;. (2.4-1)


i

En este caso, [¡ es el factor atómico de dispersión para el iésimo átomo de la


celda unitaria y cp¡ se relaciona con la diferencia de fase entre la radiación dispersada
en el origen y la dispersada del iésimo átomo de la celda unitaria. La suma se
obtiene, tomando en cuenta todos los átomos que pertenecen a la celda unitaria. La
diferencia de fase cjJ¡ está dada por (2.3-2), de donde (2.4-1) se puede expresar como
sigue:

F(h'k'l') = ¿¡;e<2xi/.l.)(r;·N>, (2.4-2)


i

en donde r¡ es un vector desde el origen hasta el iésimo átomo de la celda unitaria.


Si las coordenadas de posición fraccionales del iésimo átomo son (x¡, y¡, z¡), de
acuerdo con lo definido en la sección 1.4, entonces, r¡ se puede expresar así:

f¡ = X¡a + y¡b + Z¡C. (2.4-3)

Sin embargo, de acuerdo con la ecuacwn (2.2-6), a · N= h'X, etc.; substi-


tuyendo la (2.4-3) en la (2.4-2) y utilizando este resultado, se encuentra que

r; ·N= A(h'x¡ +k' y¡+ l'z;), (2.4-4)

de donde F(h'k'l') = Lf¡e2xi(h'x;+k'y1 +1'z;). (2.4-5)


i
Factor geométrico de lo estructura 41

Cuando todos los átomos del cristal son idénticos, el resultado se puede expre-
sar en una forma especialmente simplificada, porque, en ese caso, todas las[¡ tienen
el mismo valor f Por tanto, la ecuación (2.4-5) se convierte en

F(h'k'l') = fS (2.4-6)

en donde S= L e2ni(h'.x¡+k'y¡+l'z¡). (2.4-7)


i

Por tanto, la amplitud total dispersada está dada por el producto del factor de
dispersión atómica y un factor S, que está regido por la disposición geométrica de
los átomos, dentro de la celda unitaria y que se conoce como el factor geométrico
estructural. Para los cristales en los que no todos los átomos son idénticos, esta
separación es imposible y, en tales casos, se utilizará la forma más general (2.4-5).
La intensidad del haz difractado es proporcional al cuadrado de la amplitud F
o, más exactamente, dado que F es compleja, al cuadrado del valor absoluto de F,
que es F* F, en donde F* es el conjugado complejo de F Si F(h' k' l '), como lo
expresa (2.4-5), se escribe como el número complejo a+ i{3, entonces, F* =a- i(3 y

(2.4-8)

en donde a:= Re(F) = L [f; cos 2n:(h'x; +k' y;+ l'z;)], (2.4-9)
i

y P = Im(F) = L [J¡sen 2n:(h'x; +k' y¡+ l'z¡)]. (2.4-10)


i

Como ejemplo, se verá el caso de un cristal cúbico centrado en el cuerpo, en


el que todos los átomos son idénticos. En esta estructura, se tienen dos átomos
dentro de la celda cúbica unitaria: un átomo del vértice y otro en el centro del
cuerpo; se procede a asignar arbitrariamente el átomo del vértice cuyas coordenadas
(x¡, y¡, z¡) son (0, O, O) a la celda unitaria y no se consideran los otros átomos de
vértice; el otro átomo de la celda es el del centro del cuerpo, que pertenece exclu-
sivamente a la celda unitaria, cuyas coordenadas son (t.t.t). Por tanto, de acuerdo
con esta situación, la amplitud de difracción para la dirección de difracción (h' k' l ')
es la que señalan las expresiones (2.4-6) y (2.4-7),

F(h'k'l') = fL e2>ti(h'.x,+k'y,+t'••> = f[l + ein(h'+k'+t'>]. (2.4-11)


i

Puede pensarse que la forma en que un átomo de vértice se asignó a la celda


y los otros se excluyeron, es demasiado arbitraria, por lo que se puede proponer un
procedimiento más razonable, en el que i de cada átomo de vértice se asigna a la
celda, dejándolos en sus respectivas ubicaciones~ Esta forma alternativa de proceder
lleva exactamente a la misma expresión que la que se obtuvo en (2.4-11) para el
factor de estructura geométrica. La verificación de esta afirmación quedará como
tarea para el lector. En general, la asignación de los átomos que pertenecen a la
celda unitaria puede hacerse en cualquier forma arbitraria, como antes se hizo, siem-
pre que se le asigne a ésta el número correcto de átomos de cada categoría (cara,
vértice, borde, interior).
42 Análisis cristalográfico con rayos X

De acuerdo con (2.4-11), el factor geométrico de la estructura 1 + exp(hr(h' +


k' + l ')] desaparece para cualquier reflexión (h'k'l ') para la que h' +k'+ l' sea un
número impar, ya que exp(mri) = -1 cuando n es impar. Por tanto, en la estructura
cúbica centrada en el cuerpo, faltan ciertas reflexiones (h'k'l '), que estarían pre-
sentes en una estructura cúbica simple, con la misma dimensión lateral del cubo. Por
ejemplo, no existe una reflexión (100), aunque sí se tiene la reflexión (200); del
mismo modo, no hay la reflexión (111) aunque se tiene la (222). Este efecto se
puede comprender físicamente, cuando menos en el caso de la reflexión (100),
observando primeramente que para una estructura cúbica simple, los haces reflejados
desde las caras superior e inferior del cubo de la celda unitaria, difieren 2rr en fase
para la dirección de difracción (1 00). Sin embargo, en la estructura cúbica centrada
en el cuerpo que tiene la misma dimensión lateral del cubo, existe otro plano de
átomos (centros de cuerpos), ubicados paralelamente y a la mitad entre los planos
de las caras superior e inferior del cubo de las celdas unitarias, como put..de verse en
la figura 2.7. La densidad de átomos en estos planos intermedios es la misma que la
de los planos de las caras superior e inferior del cubo y, por tanto, dan origP.n a
haces difractados, con la misma intensidad que los producidos por los planos supe-
rior e inferior de la celda unitaria; pero están fuera de fase con estos haces por rr
radianes. Los haces difractados desde los planos superiores y los del centro del
cuerpo interfieren en forma destructiva en pares, sin producir un haz difractado neto
para este conjunto de condiciones. No obst?.nte, la reflexión (200) está presente,
debido a que, en ese caso, los planos superior e inferior dan origen a haces que
están 4rr fuera de fase. Entonces los planos de los centros de cuerpo contribuyen,
con haces que difieren 2rr en fase de las reflexiones obtenidas de los planos superior
e inferior, reforzándolos en lugar de cancelarlos. Las otras reflexiones faltantes para
la estructura cúbica centrada en el cuerpo se pueden explicar físicamente, siguiendo
la misma trayectoria de razonamiento.

Los haces
se refuerzan

(1 00) reflexión Celda unitaria c.c.c.


reflexión (200)

Figura 2.7. Relaciones de fase para los ángulos de difracción (100) y (200), en una estructura
cúbica centrada en el cuerpo.
La red reciproca 43

2.5 LA RED RECIPROCA

En este punto, conviene presentar el concepto de la red recíproca, que es una


estructura reticular de puntos, que está relacionada en cierta forma con la red
cristalina real. La condición de Bragg para la difracción de rayos X se puede ex-
presar en una forma muy sencilla con la ayuda de la red recíproca y en uno de
Jos vapítulos posteriores se verá que el comportamiento mecánico ondulatorio de los
electrones en las redes cristalinas periódicas se entiende más fácilmente en relación
con la red recíproca del cristal.
Si a, b y e son los vectores primitivos de translación de una red cristalina real,
los vectores primitivos de translación de la red recíproca, a*, b*, y e* se definen
mediante las relaciones

a*· a= b* • b =e*· e= 1 (2.5-1)

y a*· b =a*· e= b* ·e= b* ·a =e*· a= e*· b =O. (2.5-2)

Puesto que, de acuerdo con (2.5-2), a* • b =a* · e= O, el vector a* es perpendicular


al plano determinado por b y c. En consecuencia, es paralelo al vector b x e y se
puede expresar como un múltiplo de ese vector, esto es

a*= A(b X e), (2.5-3)

en donde A es una constante escalar. Sin embargo, de acuerdo con (2.5-1)

a* ·a= A(b X e)· a= 1, (2.5-4)

de donde, resolviendo para A y substituyendo el valor así obtenido en {2.5-3),

a* = b X e
. (2.5-5)
a· b X e

De igual manera, se puede demostrar que

b* = e X a
a· b X e

* = a-X- b-
e
a· b X e

Si se utiliza el mismo planteamiento general, se pueden obtener las siguientes


transformaciones inversas

b* X e*
a = a* . b* X e*, (2.5-6)

etcétera.
Como ejemplo, supóngase que se desea determinar la red recíproca de una
estructura cúbica centrada en la cara. Se debe principiar con la celda unitaria pri
44 Análisis cristalográfico con rayos X

mitiva de la figura 1.5(a), para la cual, los vectores de base primitivos a, b y e se


pueden expresar como sigue:

a('lx + .,
a= 2 .)

(2.5-7)

e= 2.a('•, + •.'
.)

en donde a es el lado de la celda cúbica y en donde el eje de la coordenada x se


toma a lo largo de a, el eje y va sobre b y el eje z pasa por c. Entonce~,
2
a4 Ci.x + i.) X (i, + i.) 1
*
a =
b X e
= 3
(' . . )·
= - •x + •, - •. '
a· b X e a ('lx + IJI
S . ) ' [('lx + lz
. ) X ('1)1 + lz
. )] a

de igual modo, b* = -1 ('lx -


.
IJI + lz. ) ' e * = -1 ( .
-•x + .,• + ••.
•) (2.5-8)
a a

Es evidente que esos vectores tienen las direcciones cúbicas diagonales, al igual
que los vectores primitivos de la estructura cúbica centrada en el cuerpo, como se
puede ver en la figura 1.5(b). Además, se debe observar que el espaciamiento reticu-
lar de la red recíproca es proporcional a 1/a. O sea, que cualquier vector r* que
conecte dos puntos reticulares de la red recíproca, debe tener la forma

r* =la*+ mb* + ne*, (2.5-9)

en donde /, m y n son enteros; al substituir las expresiones correspondientes a a*,


b*, y e* de (2.5-8) en (2.5-9), es evidente que los puntos de la red recíproca deben
tener (x, y, z) coordenadas de la forma

1
(x,y,z) = - [(l + m - n), (l- m+ n), ( -l +m+ n)], (2.5-10)
a

en donde l, m y n pueden tomar cualquier valor entero. En la tabla 2.1 se presenta


una tabulación de estos puntos reticulares posibles; los diversos casilleros de la tabla
corresponden a valores específicos de l y m, esto hace que la forma de las coorde-
nadas indicadas en cada casillero varíe sólo con n, de acuerdo con (2.5-1 0), en
función de los valores correspondientes de l y m, ahí incluidos. En la tabulación que
se da aquí, cualquier punto cuya coordenada x, y o z exceda de 2 (aparte del
factor constante 1/a, que no se incluye en las entradas de la tabla), queda descar-
tado por completo; por tanto, los puntos que se conservan son suficientes para
describir 8 celdas unitarias de la red recíproca. Cuando se grafican estos puntos,
insertando el factor constante 1/a -y se considera la forma que tienen los vectores
primitivos de la red recíproca- es evidente que fa red recíproca resultante es una
estructura cúbica centrada en el cuerpo, cuya dimensión lateral del cubo es 2/a. En
forma similar, se puede demostrar que la red recíproca para una estructura real
cúbica centrada en el cuerpo, es una red cúbica centrada en la cara.
TABLA 2.1.
Puntos reticulares para la red recíproca cúbica centrada en la cara
(Todos los puntos son de la fonna [(/+m- n), (/-m+ n), (-1 +m+ n)])

1= -2 1 = -1 1=0 l = 1 1=2

(-n- 4, n, n) ( -n- 3, n +- 1, n- 1) ( -n- 2, n + 2, n- 2)


m= -2 -2, -2, -2 -2, O, -2 -2, 2, 2

(-n-3,n-1,n+1) (-n-2,n,n) (- n - 1, n + 1, n - 1) (- n, n + 2, n - 2)
-2, O, O -1,1,-1
m= -1 --2, -2, o -1, -1, -1 - 2, 2, O O, 2, - 2
O, -2, -2 0,0, -2

( -n- 2, n- 2, n + 2) ( -n- 1, n- 1, n + 1) (-n, n, n) (1-n,n+ 1,n-1) (2 - n, n + 2, n - 2)


-1, -1,1 0,0,0 1, 1, -1
m=O -2, -2, 2 -2, o, 2 -1, 1, 1 O, 2,0 2, 2, -2
O, -2,0 -2, 2, 2 2,0, -2
1, -1,-1
2, -2, -2

(- n, n - 2, n + 2) (1 - n, n- 1, n + 1) (2- n, n, n) (3-n,n+ 1,n-1)


1, -1, 1 2,0,0
m= 1 O, -2,2 0,0,2 1, 1, 1 2,2,0
2, -2, o O, 2, 2

(2 - n, n - 2, n + 2) (3- n, n- 1, n + 1) (4- n, n, n)
m=2 2, -2,2 2,0,2 2, 2, 2
46 Análisis cristalográfico con rayos X

Una de las propiedades de la red recíproca es que un vector r* = h'a* +


k'b* +!'e* desde el origen hasta cualquier punto reticular de la red recíproca es
normal al plano (hk[) de la red real. En este caso, la tríada (hkl) es, simplemente, la
tríada (h'k'l') dividida por el factor común mayor, n entre (h'k't'), al igual que se
hizo en la sección 2.2. En otras palabras, h'/h =k'/k= 1'/l = n. Para demostrar este
resultado, se puede observar en la figura 2.8 que el vector AC es igual a - (a/h) +
(e/[), y queda dentro del plano (hkl), al igual que el vector AB, que es igual a
- (a/h) + (b/k). Sin embargo, utilizando las expresiones (2.5-1) y (2.5-2),

h' 1'
r* · [ -(a/h) +(e//)]= (h'a* + k'b* + l'e*) · [ -(a/h) + (ejl)] =- h +-¡=O,

(2.5-11)

puesto que h'/h = 1'/l = n, de acuerdo con (2.2-6). De igual modo,


h' k'
r* · [ -(a/h) + (b/k)] = (h'a* + k'b* + l'e*) · [ -(a/h) + (b/k)] = - h +k= O.
(2.5-12)
e

Figura 2.8. Geometría vectorial en la red directa para los cálculos de la sección 2.5.

Por tanto, el vector r* es perpendicular a dos vectores linealmente independien-


tes, AC y AB, que se encuentran dentro del plano (hkl). Luego, debe ser perpen-
dicular al plano propiamente dicho.
Del mismo modo, si n es un vector unitario normal al plano (hk[) de la red
real, se puede escribir n = r*/r*, ya que se sabe que r* es un vector normal a (hkl).
No obstante, si d es la distancia entre los planos adyacentes (hkl), de acuerdo con
(1.5-2), debe ser verdad que

a· n a· r* a· (h'a* + k'b* + /'e*) n


d=-=-= -- (2.5-13)
h hr* hr* - r* '

por lo que la magnitud de r* está dada por

r* -= n/d, (2.5-14)

en donde n es un entero que se defme como se indica en la ecuación (2.2-6).


La condición de Bragg 47

2.6 LA CONDICION DE BRAGG EN FUNCION


DE LA RED RECIPROCA

La condición de Bragg se puede expresar como una relación entre vectores en


la red recíproca. En la figura 2.9, el vector AO que tiene una longitud 1/A. está
trazado en la dirección del haz incidente de rayos X y termina en el origen de la
red recíproca. Se observará que el origen del vector AO no debe encontrarse necesa-
riamente en un punto reticular de la red recíproca. Se construye una esfera de radio
lA alrededor del punto A, que es el centro. Supóngase ahora que esta esfera inter-
secta algún punto (h'k'l ') de la red recíproca en B. Por tanto, el vector OB repre-
senta al vector que conecta el origen de la red recíproca con un punto (h'k'l ') de la
red; como tal, debe ser normal al plano (hkl) de la red real y también debe tener la
longitud n/d, donde n es el factor común entero de mayor valor a los tres números
(h'k'l '). Sin embargo, de acuerdo con las relaciones trigonométricas de la figura 2.9,
la longitud de OB se puede expresar también como 2 sen 0/A.. Si se igualan estas dos
expresiones para la longitud del vector OB, se tiene que

n). = 2d sen e,
y se satisface la condición de Bragg. En relación con la figura 2.9, también es
evidente que el vector OB representa una normal a los planos de reflexión (hkl) y
que el vector AB lo es en la dirección del haz difractado. Esta última proposición se
entenderá con mayor claridad, si se traslada el vector AB paralelo consigo mismo,
hasta que su origen descanse en el punto O, en que se verá que AO, OB y AB están
en la relación familiar de la dirección del haz incidente, así como la dirección
normal de dispersión y del haz de difracción. De acuerdo con esta construcción
geométrica, es evidente que la condición de Bragg se satisfará para una longitud de
onda dada por cada intersección de la superficie de una esfera de tadio 1/A. trazada
alrededor de A, con un punto de la red recíproca. En cada caso, el ángulo apro-
piado de Bragg estará dado por el ángulo comprendido entre el vector AO y un
plano normal a OB. Cuando la condición de Bragg se satisface en esta forma, los
vectores AO y AB constituyen un triángulo isósceles con un vector OB de la red
recíproca. De acuerdo con esta disposición de los vectores, como se ilustra en la

Figura 2.9. Geometría vectorial de la reflexión de Bragg en la red recíproca.


48 AniÍiisis cristalográfico con rayos X

figura 2.9, se puede observa~ que AB debe ser la suma vectorial de AO y OB y la


geometría vectorial de la figura 2.9 permite expresar la condición de reflexión de
Bragg, en un forma especialmente sencilla.
Para este fin se supone que todos los vectores de la figura 2.9 se multiplican
por un factor escalar constante de 27T, como se indica en la figura 2.10. Por tanto,
en esta figura, el vector G es simplemente 27T veces el vector OB de la figura 2.9 y
el vector k es 27T veces el vector AO de la figura 2.9. También en este caso, la
disposición de los vectores es tal que el vector A 'B' de la figura 2.1 O debe ser la
suma vectorial de k y G. Puesto que la magnitud de ese vector y la del vector del

8'

Figura 2.10. Diagrama vectorial de la figura 2.9, ampliado de acuerdo con un factor escalar de
27T y rotulado nuevamente (la notación va de acuerdo con la utilizada por C. Kittel
en /ntroduction to Solid Sta te Physics. J ohn Wiley & Sons, Nueva York (1956).

haz incidente k deben ser iguales, en todos Jos casos en que se satisface la condición
de Bragg, ésta debe implicar que

(k + G) 2 = (k + G) • (k + G) = k 2 , (2.6-1)
o bien, desarrollando el producto y simplificando,

2k · G + G2 =O, (2.6-2)
en donde G es 27T veces un vector desde el origen hasta un punto reticular de la red
recíproca, en donde k es un vector de magnitud 27T/A a lo largo de la dirección del
haz incidente de rayos X. La ecuación (2.6-2) es la forma vectorial de la ecuación
de Bragg. 4

EJERCICIOS

l. l·.n un cristal cúbico se oh~erva una reflexión de primer orden (1 00) a un ángulo
incidente de 18° utilizando una radiación X de longitud de onda de 1 5 A ¿Cuál es la di~tancia
~ntre lo~ planos (1 00) del cristal?

4 Esta construcción la originó Ewald (P.P. Ewald, Zeitschrift für Kristallographie 56, 129
(1921) y se denomina, a veces, construcción de Ewald.
La condición de Bragg 49

2. Para el átomo de hidrógeno en su estado energético más bajo, la función de onda está
dada por

en donde a0 es el radio de la primera órbita de Bohr, h2j4rr2me2 = 0.53 A. La densidad


electrónica para este tipo de átomo está dada por 1/Jfs 1/1 19 , por lo que

e-2rJ•o
p(r) =--.
7TQ~

Si se utiliza esta función de distribución de densidad electrónica, calcule el factor de dispersión


atómica para un cristal hipotético, compuesto de átomos de este tipo y grafíquela como función
de p. ( = 4rr sen (} (l\).
3. Sea una estructura cúbica centrada en el cuerpo, en la que todos los átomos son
idénticos. Demuestre que asignándole a la celda unitaria un octavo de cada átomo de vértice -en
su ubicación respectiva de coordenada celular- y el ítomo del centro del cuerpo -en la posición
central- se obtiene el mismo resultado para el factor geométrico de estructura de esta red, que
derivando dicho factor de acuerdo con la ecuación (2.4-11 ).
4. Encuentre la amplitud de difracción F(h'k'l ') para la reflexión (h'k'l ') de un cristal que
tiene la estructura del CsC'l, como se ilustra en la figura 1.7(b). ¿Se podría esperar una reflexión
(100) en este cristal? Explique por qué.
5. Encuentre el factor geométrico de estructura para la red cúbica centrada en la cara
(donde todos los átomos son idénticos). ¿Cuál de las siguientes reflexiones de rayos X habrá en
un cristal de este tipo y cuál faltará en él: (100), (110), (111), (200), (220), (222), (211),
(221 ), (123)?
6. Determme el factor geométrico de estructura de la red de diamante. Exprese el resul-
tado como el producto del factor geométrico de estructura para la red cúbica centrada en la
cara por otro factor. Indique cuáles de las reflexiones de rayos X mencionadas en relación con
el problema 5 se encuentran en dicha estructura y cuáles faltarán en ella? Nota: asigne los
átomos a una celda unitaria cúbica, de acuerdo con el diagrama de la figura 1.9.
7. Demuestre que la red recíproca de una estructura cúbica simple es otra red cúbica
simple, de donde, dicha estructura es autorrecíproca.
8. Demuestre que la red recíproca de una red cúbica centrada en el cuerpo es una estruc-
tura cúbica centrada en la cara. Haga una tabla de los puntos reticulares y grafíquelos para
formar un diagrama, basándose en sus resultados.

LECTURAS RECOMENDADAS
W. H. Bragg, An Introduction to Crystal Analysis, G. Bell & Sons, Londres (1928).
W. L. Bragg,The Crystalline State, Vol. 1, G. Bell & Sons,.,.Londres (1955).
R. B. Leighton, Principies o[ Modern Phys;cs, McGraw-Hill Book Company, Inc., Nueva York
(1959).
A. Taylor, X-Ray Metallography, John Wiley & Sons, Nueva York (1961).
CAPITULO 3
Dinámica de las
redes cristalinas

3.1 VIBRACIONES ELASTICAS DE MEDIOS CONTINUOS

Ahora se investigarán las características del movimiento elástico vibratorio de


las redes cristalinas. Se encontrará que existen diferencias importantes entre las on-
das elásticas, en las estructuras reticulares compuestas de átomos discretos y las ondas
que hay en los medios elásticos completamente continuos y homogéneos. Para en-
tender estas diferencias con toda claridad, primeramente se hará un repaso breve de
algunas características esenciales de las ondas elásticas en substancias elásticas homo-
géneas, isotrópicas y lineales. Se analizará detalladamente tan sólo el movimiento
ondulatorio unidimensional, pero siempre que sea necesario se tratará de indicar
cómo se pueden generalizar los resultados obtenidos para describir sistemas de dos y
tres dimensiones.
Sea un elemento de una substancia elástica isotrópica y homogénea, de lon-
gitud tu y el área transversal uniforme ~Y l:!.z. Cuando no hay deformaciones este
elemento se extiende de x a x + ÁX a lo largo del eje x, como se ilustra en la
figura 3.1, pero al aplicarle un esfuerzo, se produce una deformación elástica, la

-u+~u-1
I
(l
Areo t:J.yt:J.z
\r------t----i-1---.
r-u- -u-:t:J.u--::___
- F=ce(x+t:J.x)t:J.yt:J.z
F =ce (x) !:J. y tJ. z .._-------+---+-...J
1 t:J.x-----1
X x+t:J.x

Figura 3.1. Desplazamiento y deformación de extensión de un elemento de volumen que origi-


nalmente se extendía de x a x + &. En la condición deformada, el elemento se
extiende de x'+u a x + ~x +u+ ~u.

poSictOn de equilibrio del extremo izquierdo del elemento se desplaza una distan-
cia u a lo largo del eje x, y el extremo derecho del elemento se desplaza una distancia
u + &. Si el medio elástico es lineal, el esfuerzo aplicado y la deformación resul-

51
52 Dinámica de las redes cristaliiUls

tante se relacionan linealmente, mediante la ley de Hooke. La deformación s se


define como la extensión elástica del elemento por unidad de longitud, es decir

, Au ou
s(x)= hm - = - , (3.1-1)
&x--+O Ax ox
mientras que el esfuerzo es la fuerza por unidad de área que actúa sobre el ele·
mento. Por tanto, de acuerdo con la ley de Hooke, si F(x) es la fuerza total que
actúa en el punto x,

F(x) = cs(x)Ay Az, (3.1-2)

en donde e es el módulo elástico del material. Del mismo modo, en el punto


X+ _ax,
F(x + Ax) = cs(x + Ax)Ay Az. (3.1-3)

La fuerza total ejercida sobre el elemento se debe relacionar con la aceleración


del elemento, de acuerdo con la ley de Newton, por lo que

F(x + Ax) - F(x) = c[s(x + Ax) - s(x)]Ay Az = ma, (3.1-4)

en donde m es la masa del elemento y a su aceleración. Desarrollando s(x + & )


como una serie de Taylor, con respecto al punto x, y descartando los términos de
segundo o mayor orden en .ax, que en cualquier caso se perderían en el límite,
conforme .ax -+ O, se encuentra que

os
e ox Ax Ay Az = ma. (3.1-5)

Sin embargo, la masa del elemento es su intensidad p por el volumen


.ax Lly &, la aceleración es a2 ujat 2 , y la deformación, de acuerdo con la definición
{3.1-1) es au;ax. Al efectuar estas substituciones, (3.1-5) se convierte en

ou2 p o2 u
(3.1-6)
ox 2 =~ ot 2 •
Esta es la ecuación de onda para la amplitud de ondas elásticas en un medio
lineal homogéneo, en función de x y t, en donde la deformación elástica se limita a
la dirección x.
Las soluciones a esta ecuación se pueden escribir en la forma
u(x,t) = Aei<wr-znxt.l.l = Aei<wr-kx>, (3.1-7)

en donde,

k= 2nfA. (3.1-8)

La solución (3.1-7) representa una perturbación sinusoidal de frecuencia w y lon-


gitud de onda X, que se propaga a lo largo del eje x positivo. Por lo general, es más
conveniente expresar los resultados de un cálculo relativo a las vibraciones armónicas,
en términos de la constante de propagación k, que en función de X propiamente
Velocidad de grupo de trenes de ondas armónicas 53

dicha. La dirección de propagación de la onda se invierte, cambiando el signo de k.


Si la solución (3.1-7) se diferencia y se substituye de nuevo en la ecuación ondula-
toria (3.1-6), se verá que, para satisfacer (3.1-6), w y k deben relacionarse mediante

ro= kJcfp. (3.1-9)

La velocidad de fase de una onda es la razón de avance de un punto de fase


constante a lo largo de la dirección de propagación de la onda. Para determinar la
velocidad de fase, se puede examinar el movimiento de un punto de fase constante
y, para mayor facilidad, se utilizará un punto de fase cero. Puesto que el ángulo de
fase es wt- kx, de acuerdo con (3.1-7), la ecuación de movimiento del punto de
fase cero es,

rot- kx =O

o bien,
(3.1-10)

Como se puede ver, el punto de fase avanza a una velocidad constante de fase
vP igual a w/k. De acuerdo con la ecuación (3.1-9), la velocidad de fase para estas
ondas se puede expresar como

vP = wfk = Jcfp, (3.1-11)

de donde, es evidente que la ecuación de onda (3.1-6) se puede escribir como sigue

(3.1-12)

Para este caso en particular, la velocidad de fase es independiente de la fre-


cuencia y la longitud de onda, y sólo depende de las constantes físicas e y p,
relacionadas con el medio elástico.

3.2 VELOCIDAD DE GRUPO DE TRENES DE ONDAS ARMONICAS

Ahora se investigará lo que sucede cuando se superponen dos trenes de ondas,


uno de frecuencia w y constante de propagación k el otro con una frecuencia
ligeramente distinta, w + dw y constante de propagación k+ dk. Para mayor faci-
lidad, se supondrá que las amplitudes máxima de los dos trenes de ondas son
idénticas, en cuyo caso, ambas amplitudes se expresan como sigúe:

u 1 =A cos (wt- kx)


(3.2-1)
u 2 =A cos [(ro+ dro)t- (k+ dk)x].
La amplitud de la superposición es, entonces,

u1 + u2 = A[cos (rot- kx) + cos [(ro+ dro)t- (k+ dk)x]] = A[cos a+ cos p].
(3.2-2)
54 Dinámica de los redes cristalinas

Sin embargo, tomando como base la trigonometría elemental,

cos ex+ cos p = 2 cos t(ex - p)cos !(ex + p), (3.2-3)


y, de acuerdo con (3.2-2), se tiene que

ex+ P= 2rot - 2kx + tdro- xdk ~ 2(rot - kx), (3.2-4)


y

ex - p= xdk - tdro. (3.2-5)


En (3.2-4), los términos diferenciales tdw y xdk se pueden hacer a un lado,
teniendo en cuenta que son pequeños, en comparación con los otros términos; en
(3.2-5) no hay términos "grandes" y los términos diferenciales son importantes. Al
substituir (3.2-4) y (3.2-5) en (3.2-2), se tiene que

u1 + u 2 = 2A cos (rot- kx) cos (tx dk- !t dro). (3.2-6)


Esta superposición representa una onda caracterizada por los valores originales
de w y k, multiplicados por una envolvente sinusoidal con una longitud de onda
mucho más larga, 21T/dk, denominada "envolvente de pulsaciones", como se ilustra
en la figura 3.2. Se puede examinar el movimiento de esta envolvente y, sobre todo,

2,.
k

Figura 3.2. Tren de ondas formado al superponer dos ondas sinusoidales cuyas frecuencias son
w y w +dw y con constantes de propagación de k y k +dk.

la velocidad de fase de la envolvente (correspondiente a la velocidad de los grupos o


"pulsaciones", a lo largo de la dirección de propagación) determinada mediante el
mismo procedimiento que se utilizó para una onda armónica simple, en la sec-
ción 3.1. La ecuación del movimiento del punto de fase cero de la envolvente es

x dk - t dw = O,
o bien,
dw
x=-t=vt
dk g o
(3.2-7)

Por tanto, se ve que la envolvente o los grupos de ondas se desplazan con una
velocidad dw/dk; que se denomina velocidad de grupo, v.rr, asociada con las ondas.
Se puede demostrar que la velocidad con que la onda transmite energía a lo largo
de la dirección de propagación es idéntica a esa velocidad de grupo. 1 Como puede

1 L. Brillouin, Wave l'ropa!!;ation in Perwdic Structures, Dover Publications, lnc., Nueva


York (1953)
Movimiento ondulatorio en redes atómicas unidimensionales SS

verse, esto es lógico desde el punto de vista físico, por ejemplo, en el tren de ondas
de la figura 3.2, no puede fluir energía más allá de un nodo, ya que el medio en el
punto nodal está totalmente inmóvil. Por consiguiente, la energía se debe transmitir
a la velocidad a la que se mueven los nodos, es decir, a la velocidad de grupo. En el
caso de una onda estacionaria, la velocidad de grupo es cero y es evidente que no
puede haber un flujo neto de energía.
Para las ondas elásticas en un medio homogéneo, que se estudiaron en la
sección 3.1, la velocidad de fase y la de grupo son iguales, de acuerdo con la
ecuación (3.1-9). Esto es cierto debido a que w es una función lineal de k, de
donde, w/k y dw/dk son iguales. El mismo resultado se aplica también a las ondas
electromagnéticas en vacío, dado que también en este caso, la velocidad es una
constante independiente de la frecuencia y la longitud de onda. La velocidad de fase
y la velocidad de grupo sólo pueden diferir cuando la primera w/k es una función
de la frecuencia w, y por tanto, cuando la misma w no es una función lineal de k.
Por ejemplo, esta situación se presenta cuando hay una luz que pasa por un medio
en el que el índice de refracción (y, por ende, la velocidad de fase) es una función
de la frecuencia; el fenómeno se conoce como dispersión y dicho medio se deno-
mina medio dispersivo o de dispersión. Como ¡,~ verá en breve, también sucede en el
caso de ondas elásticas, en un medio compuesto de átomos discretos enlazados por
las fuerzas de la ley de Hooke, sobre todo cuando las longitudes de onda de que se
trata no son mucho mayores que las distancias interatómicas.

3.3 MOVIMIENTO ONDULATORIO EN REDES ATOMICAS


UNIDIMENSIONALES

Ahora se examinará el movimiento vibratorio longitudinal de una cadena uni-


dimensional de átomos idénticos de masa m, que están unidos entre sí mediante
fuerzas lineales, como se indica en la figura 3.3. En estado de equilibrio, los átomos
estarán situados en puntos de equilibrio igualmente espaciados; pero en estado de
excitación producido por el movimiento vibratorio, los átomos realizan movimientos
periódicos alrededor de estas posiciones de equilibrio, en este caso, la amplitud Un
representa el desplazamiento real del nésimo átomo, desde su posición de equilibrio.

n-2 n-1 n n+l n+2


~a
En reposo:
+ a
+ a
+ a----4

~ ~t ~t
Vibrando

Un-1 un
~ t
Un+ 1
t
Figura 3.3. Geúmetría de la red lineal monoatómica de la sección 3.3.

Se supone que las fuerzas entre los átomos circunvecinos son las de la ley de
Hooke, y que los átomos se comportan como si estuviesen unidos por medio de
resortes ideales, suponiéndose también que las únicas interacciones de fuerzas signifi-
cativas, son las que se ejercen directamente entre los átomos más cercanos. De
donde la influencia directa de los átomos n + 2, N+ 3, n + 4 ... sobre el átomo n
56 Dinámica de las redes cristalinos

se considera despreciable, aunque el comportamiento del átomo n + 2, por ejemplo,


puede influir indirectamente en el átomo n en el sentido de que afecta directamente
al átomo n + 1 que, a su vez, actúa sobre n. De acuerdo con estas suposiciones, la
fuerza neta que actúa sobre el nésimo átomo se puede expresar en términos de la
extensión de dos "resortes" que lo unen a los átomos n + 1 y n - l. Así:

= {3(u.+ 1 + !1 11 _ 1 - 2u,). (3.3-1)

en donde (3 es la constante de la ley de Hooke, que expresa la proporcionalidad


existente entre la fuerza requerida para producir un desplazamiento atómico y el
desplazamiento propiamente dicho.
De acuerdo con la segunda ley de Newton, esta fuerza se puede expresar como
el producto de masa m del nésimo átomo por su aceleración, de donde, se obtiene
la ecuación del movimiento

(3.3-2)

Se buscan soluciones periódicas a esta ecuación y se puede esperar que tengan


la forma

(3.3-3)
en analogía con (3.1-7). Sin embargo, en la expresión (3.3-3) se debe representar el
coeficiente de k del exponente como la coordenada x ael nésimo átomo de la
cadena, es decir, na. De acuerdo con esto. se puede esperar que
un+l = Aei[wt-k(ll+l)aJ
y

Un-l = Aei[wt-k(n-l)•J. (3.3-4)

Si la solución (3.3-3) se diferencia dos veces con respecto al tiempo y, junto


con la (3.3-4) se substituye de nuevo en la ecuación de movimiento (3.3-2), el
resultado es

= 2{3(cos ka - 1). (3.3-5)

Sin embargo, dado que

1 -cosO= 2 sen~ !0, (3.3-6)

esto se puede expresar en la forma

01 = ,./4fJ/m lsen-!kal. (3.3-7)


Movimiento ondulatorio en redes atómicas unidimensionales 51

Los signos de valor absoluto se requieren en (3.3-7), por la única razón de que
la frecuencia se debe considerar como una cantidad esencialmente positiva, sin im-
portar de que k sea positiva o negativa, es decir, sin importar que la onda se
propague hacia la derecha o la izquierda, a lo largo de la cadena.
En consecuencia, se observa que existen soluciones de la forma (3.3-3), a
condición de que w se relacione con k, mediante (3.3-7). Es obvio que, en este
caso, w no es una función lineal de k, de modo que aquí se trata un medio de
dispersión; una relación del tipo de (3.3-7) que presenta a w en función de k, se
conoce como relación de dispersión. En la figura 3.4 se muestra una gráfica de w
en función de k, como se da en (3.3-7). De acuerdo con esto (y (3.3-7)), se
observará que, si se restringen los valores de k, mucho menores que rrja, y, por
ende, a valores de "A que son mucho mayores que el doble de la distancia interató-
mica a, w es aproximadamente lineal, con k, ya que, en ese caso, sen-!- ka~-!- ka y

(3.3-8)
En este límite de longitud de onda larga, la velocidad de fase será esencial-
mente constante, ya que

vP = wfk = aJ{3/m = v0. (3.3-9)


En este mismo límite, la velocidad de grupo es

(3.3-10)

y, por tanto, constante e igual a la velocidad de fase en esas condiciones. En


consecuencia, para longitudes de onda muy largas, los efectos de dispersión son
desechables y el medio se comporta como si fuera elástico, continuo y homogéneo.
Por supuesto, esto es plausible desde un punto de vista físico, ya que, para este tipo
de longitudes de onda largas, la naturaleza "atómica" de la cadena tiene poca impor-
tancia en lo que respecta al comportamiento dinámico del sistema. No obstante, al
aumentar k, los efectos de dispersión se hacen cada vez más importantes y w deja

w(k)

_,------------~------------r--k
-7T
o o 1T
o

Figura 3.4. Relación de dispersión de red lineal monoatómica de la sección 3.3.


58 Dinámica de las redes cristalinas

de variar en forma lineal, en función de k. En estas circunstancias, se observa que,


de acuerdo con (3.3-7),

vP = wfk = v0 lsentkal
!ka (3.3-11)
y
v9 = dwfdk = v0 leos tkal, (3.3-12)

en donde v0 =a .Jlflm es el límite de longitud de onda larga, tanto de vP como de


vg, como lo demuestran (3.3-9) y (3.3-1 0). En las figuras 3.5 y 3.6 se presentan las
gráficas de vp y Vg, como funciones de k.
En la figura 3.6 se observa que vg-+ O conforme k-+ rr/a y, por tanto, con-
forme A-+ 2a; en este caso, la fase de vibración de los átomos adyacentes difiere en
rr radianes y la naturaleza del movimiento es sencillamente una onda estacionaria.
Esta condición corresponde también a la reflexión de Bragg de las vibraciones elás-
ticas de átomos sucesivos del cristal; para esta geometría, el ángulo 8 de Bragg de la
ecuación de Bragg (2.1-1) es rr /2 correspondiendo a la incidencia normal, en cuyo
caso, la ecuación de Bragg se reduce a A = 2d para el primer orden de reflexión. La
naturaleza física real del movimiento se ilustra en la figura 3.7, para el caso de una
longitud de onda larga y para la condición A = 2a, en la que se establecen las ondas
estacionarias. En estas figuras, los desplazamientos atómicos se representan como
movimientos transversales, para facilitar la ilustración, aunque, por supuesto, los mo-
vimientos atómicos reales que se analizan aquí son de tipo longitudinal, en el que

Vp

-6,. -2,. -., o .,. 2rr


-6a...
o
-
o o o a o -4rr
o

Figura 3.5. Velocidad de fase en función de la constante de propagación k, correspondiente a la


red lineal monoatómica. [Tomado, con permiso, de Wave Propagation in Periodic
Structures, McGraw-Hill (1946). J

Figura 3.6. Vcloddad de grupo como una función de la constante de propagación k para la
red lineal monoatórnica.
Movimiento ondulatorio en redes atómicas unidimensionales 59

~j i j ¡---¡-_,__

Figura 3.7. Desplazamientos atómicos en la red monoatómica lineal (a) para una longitud de
onda mucho mayor que el espaciamiento interatómico, (b) en el límite en donde
'A= 2a. Para mayor claridad, los desplazamientos se representan como transversales,
pero se debe tener presente que los desplazamientos reales estudiados en este texto
son longitudinales. [De acuerdo con Brillouin.]

los desplazamientos atómicos reales se efectúan a lo largo de la cadena y no en


sentido normal a ésta.
Como se ilustra en la figura 3.8, para cualquier valor de k en la región - rr/a
<k< rr/a, se tendrá un movimiento vibratorio comprendiendo ciertos desplaza-
mientos atómicos posibles. Sin embargo, como se indica también en dicha figura, el
mismo conjunto de desplazamientos de átomos que hay en esta onda, se puede
asociar asimismo con una onda de k mayor (y por ende, de una menor 'A), e incluso

Figura 3.8. Un solo grupo de desplazamientos atómicos representados por varias ondas sinusoi-
dales de diferentes longitudes de onda. [Tomado de Brillouin, Wave Propagation in
Periodic Structures, McGraw-Hill, Nueva York, (1946).]

con otra de k aún mayor. En otras palabras, pueden existir muchas representaciones
del mismo patrón de desplazamiento átomico en el que se incluya un valor distinto
de k y, en consecuencia, un valor diferente de 'A. Se puede demostrar que estas
representaciones disímbolas están asociadas con diferentes periodos de la gráfica de
w en función de k. Cada una de las representaciones posibles debe tener el mismo
valor de w por lo que, en una gráfica de w en función de k, en la que aparezcan
varios periodos de la curva, como sucede en la figura 3.9, puede haber muchos
valores de k que correspondan al mismo valor de w. En la región central, que se
extiende desde - rr/a hasta rr/a, se tiene sólo dos posibilidades, una onda que se
propaga hacia la derecha, con la constante de propagación k 1 y otra que se desplaza
hacia la izquierda, con una constan te de propagación k_ 1 = - k 1 • Las regiones mar-
cadas en esta figura con los números 2 y 2', que con tienen otras dos soluciones
posibles, k 2 y k_ 2 = - k 2 , se pueden superponer en la región central, desplazando
la región 2 hacia la izquierda una distancia 2rr/a y moviendo la región 2' una
distancia 2rr/a. El carácter de las soluciones posibles en la región 2 es el mismo que
60 Dinámica de las redes cristalinos

"'

Figura 3.9. Varios periodos de la relación de dispersión para una red lineal monoatómica. Se
observará que muchos valores de k se pueden asociar con cualquier frecuencia dada
dentro del rango permitido.

el de las soluciones posibles de la región 1' excepto por una diferencia en los valores
k de 2rr/a; lo mismo puede afirmarse de las regiones 2' y l. Del mismo modo, las
regiones 3 y 3', que contienen dos soluciones posibles para las que k = k 3 y k =
k_ 3 = - k 3 , se pueden superponer sobre la región central - rr/a <k< rr/a, despla-
zando la región 3 hacia la izquierda una distancia 4rr/a y la 3', a la derecha, una
distancia 4rr/a; la naturaleza física de las soluciones en esta región coincide, por
tanto, con la de la región central, excepción hecha de las diferencias de los valores k
de 4rr/a. Se pueden observar relaciones similares en zonas superiores. El hecho
físico importante es que cualquier arreglo posible de posiciones atómicas, que sea
compatible con una solución sinusoidal de cualquier longitud de onda, por más
pequeña que sea, se puede representar o reducirse a una solución sinusoidal para la
que - rr/a <k< rr/a. y que, por ende, pertenece a la zona central. Por consiguiente
en este caso, no es necesario considerar las vibraciones que no pertenezcan a la zona
central -rr/a <k< rr/a. Esta región central (1 y 1' de la figura 3.9) se denomina
primera zona de Brillouin; las regiones 2 y 2', y 3 y 3', etc., para las que el
carácter físico de las soluciones es el mismo que el de la primera zona, exceptuando
la traslación que se hace a lo largo del eje k, en una distancia igual a un múltiplo
entero de 2rr/a, se citan como la segunda, tercera, etc., zonas de Brillouin, respecti-
vamente. Más adelante, se representará la ocasión de utilizar el concepto de las zonas
de Brillouin, en relación con el comportamiento de la mecánica cuántica de los
electrones en las estructuras reticulares periódicas. 2
También se debe determinar cuántos modos nonnales posibles de vibración (en
otras palabras, cuántas soluciones independientes de la ecuación de onda que satis-
fagan un conjunto de condiciones de frontera) se pueden asociar con una cadena
lineal de átomos. Por ejemplo, supongamos que se tiene una cadena rígidamente fija
en ambos extremos. Si dicha cadena, que tiene una longitud L, fuera un medio
homogéneo y continuo, cualquier vibración de la forma

u(x,t) = A sen knx sen wt (3.3-13)


con
kn = nrr.JL, (3.3-14)

en donde, n es un entero, satisfaría las condiciones de frontera de que el desplaza-


miento u en ambos extremos de la cadena en x =O y x = L, debe ser cero y, por

2 Debe hacerse notar que las velocidades de fase de ondas equivalentes en diferentes Zonas
de Brillouin son distintas; pero este hecho no tiene un efecto físico directo.
Movimiento ondulatorio en redes atómicas unidimensionales 61

Figura 3.10.
~
, n =4

Conjunto de desplazamientos sinusoidales de una cuerda con vibración transversal,


que satisfacen la condición de frontera de que el desplazamiento desaparece en
ambos extremos. Estas diversas configuraciones sinusoidales se pueden considerar
como modos normales para el sistema en esta condición particular de frontera.

tanto, se calificaría como modo normal de vibración del sistema. Esta situación se
ilustra en la figura 3.1 O. Sin embargo, si la cadena se compone de átomos discretos,
el valor máximo de k está dado por rrja, y corresponde a un valor mínimo de la
longitud de onda de 2a, como se puede ver en la figura 3. 7(b ). Cualquier valor
grande de k o cualquier valor pequeño de A. corresponde simplemente a una repeti·
ción de cierta configuración que se puede describir mediante un valor de k dentro
de la zona central. De acuerdo con (3.3-4), los valores posibles de k para un sistema
de ese tipo son, k= rr/L, 2rr/L, 3rr/L, • • • rrja. No obstante, si hay N átomos en una
cadena de longitud L, cada uno de los cuales está separado de su vecino por una
distancia a, entonces, a= L/(N- 1) y, por tanto los valores permitidos de k para
vibraciones normales de esta índole es k = rr/L, 2rr/L, 3rr/L • • • (N - 1)rr/L, dando
un total de N- 1 modos. Sin embargo, para k= (N- l)rr/L, (A.= 2a) se debe excluir
en este caso, dado que no se puede excitar a menos que se muevan los átomos del
extremo, lo cual está prohibido por las condiciones de frontera. El número de
modos reales de vibración, en estas condiciones de frontera, es, por tanto N- 2, o
sea, el número de átomos de la cadena menos dos. Por supuesto, si N es un número
muy grande, no importa si el número de modos normales se considera como N- 2
o, simplemente, como N.
Conviene hacer notar que las condiciones físicas de frontera que se imponen al
sistema son las que limitan los valores posibles de k a cierto número finito de
valores, tomados del continuo de valores posibles entre - rr/a y rrja que permiten las
soluciones de las ecuaciones diferenciales de movimiento del sistema. Como lo de-
muestra la exposición anterior, cuando los extremos de la cadena se mantienen
rígidamente fijos, se seleciona un conjunto de N- 2 valores posibles de k, corres-
pondientes a las soluciones que satisfacen esas condiciones de frontera, de entre este
grupo infinito de valores posibles. Sin embargo, en cualquier problema real se deben
seleccionar ciertas condiciones de frontera en las ondas elásticas y, en lo que res-
pecta al número de modos normales posibles, se encuentra que no importa mucho
cuál de los conjuntos de condiciones se escoja, siempre que sea físicamente acep-
table. En cada caso, se tendrán básicamente N modos normales posibles de vibración,
que satisfagan las condiciones de frontera que se hayan seleccionado, a condición de
que el número de átomos N sea mucho mayor que la unidad. Se encuentra que este
resultado se aplica también en sistemas bidimensionales y tridimensionales.
En muchos casos, será útil seleccionar como condición de frontera, el requisito
de que la amplitud de vibración del Nésimo átomo sea precisamente la misma que la
del primer átomo. Desde el punto de vista físico, esto correspondería a una cadena
lineal, que se dobla para obtener la forma de un anillo, en el que el Nésimo átomo
se une al primero para cerrar la cadena. Las condiciones de frontera de esta natu-
raleza se conocen con el nombre de frontera periódica; la aplicación de estas condi-
ciones a las soluciones (3.3-3) de las ecuaciones de movimiento, producirá el mismo
62 Dinámica de redes cristalinos

resultado, a saber: que pueden existir esencialmente N soluciones de las ecuaciones


de movimiento, que satisfagan también las condiciones de frontera periódicas. Más
adelante, la demostración de este resultado se le asignará al lector como tarea y
ejercicio.

3.4 ESTRUCTURAS DIATOMICAS UNIDIMENSIONALES

Hasta ahora el examen de las propiedades dinámicas de las redes cristalinas se


ha concretado al caso en que todos los átomos de la red son idénticos. Puesto que
muchos cristales comunes son compuestos diatómicos, que contienen átomos de dos
especies químicas diferentes y, dado que las característic~s dinámicas de sus estruc-
turas difieren en varias formas importantes de los cristales monoatómicos, conviene
proceder al de las vibraciones elásticas en cristales de este tipo.
Sea una red en la que los átomos de dos especies están dispuestos en forma
alternada y cada átomo está separado de los dos átomos adyacentes por una dis-
tancia a, como se muestra en la figura 3.11. La masa del átomo ligero se representa
mediante m, y la del átomo pesado es M. También aquí se aplicarán las suposiciones
de la sección 3.3 en relación con las fuerzas de la ley de Hooke y sólo se tomarán
en cuenta las interacciones entre los átomos adyacentes. Aquí se hace necesario
escribir ecuaciones independientes para el átomo ligero y el pesado; lo cual se hace
siguiendo una analogía exacta del procedimiento de la sección 3.3, teniendo como
resultado

(3.4-1)

También ahora se deben buscar soluciones de la forma (const.)ei(wt-kx), re-


presentando la coordenada x del átomo, de acuerdo con su posición a lo largo de la
cadena, como en (3.3-3) y (3.3-4).

m M m M m M m M m M
• o • o • o •
~o-i-o~
---- 2 n-2 2n-l 2n 2n+l 2n+2 2n+3 ---

Figura 3.11. Geometría de la red diatómica lineal de la sección 3.4.

Puesto que Jos dos tipos de átomos tienen masas distintas, por lo normal, sus
respectivas amplitudes de vibración, también, serían diferentes. Además, en este
punto, no se puede f>aber que sus frecuencias son iguales -aunque, como se verá
Estructuras diatómicas unidimensionales 63

más adelante, esto es lo que sucede en este caso en particular. Por tanto, se suponen
soluciones de la fórmula

y
(3.4-2)

Si u 2 n y u2n+i están dadas por estas expresiones, de acuerdo con la regla de


que el coeficiente de k en el exponente debe representar la coordenada x del átomo
en cuestión, también debe ser cierto que

(3.4-3)

Si las soluciones (3.4-2) se diferencian dos veces con respecto al tiempo y se


substituyen de nuevo en las ecuaciones de movimiento (3.4-1), utilizando (3.4-3)
para expresar todos los desplazamientos en términos de u 2 n y u 2 n+i, se tiene que

(3.4-4)

Al resolver la segunda de estas ecuaciones para u 2 n+i, se observa que

p(l + e-2ika>
U2n+ 1 = 2 p _ Mw~ U2n· (3.4-5)

Las ecuaciones de movimiento requieren que esta relación se satisfaga para


todos los valores de tiempo. No obstante, si los valores de u 2 n y u 2 n+l tal y como
los da (3.4-2), se substituyen en (3.4-5), es evidente que este requisito se puede
satisfacer para todos los valores de t, sólo cuando w 1 y w 2 son iguales. De acuerdo
con esto, tomando

(3.4-6)

y substituyendo (3.4-5) en la primera de las ecuaciones (3.4-4), expresando los


exponenciales de acuerdo con las funciones trigonométricas y simplificando, es evi-
dente que

(3.4-7)

Al reacomodar esta ecuación y reunir las potencias de w, se tiene, por último,

4 2P(m +M) 2 4P 2 sen 2 ka


w - mM w + mM = O. (3.4-8)
64 Dinámica de redes cristalinos

Esta ecuación cuadrática en w 2 se puede resolver fácilmente mediante la fór-


mula cuadrática a fin de obtener dos soluciones para w 2 , que se designarán como
w~ y w~, según se escoja el signo + o el - en la fórmula cuadrática. El resultado es

2 _
c.o± -
P(m + M) [
mM 1±
J_ 1
4mM sen2 ka]
( m+ M)2 . (3.4-9)

w(k)

l /2~/M

1
1
1

-4--------------~--------------~k
l-..!:.
2o o 1 ;o
Figura 3.12. Relación de dispersión correspondiente a la red diatómica lineal, donde se mues-
tran las ramas Óptica y acústica.

En la figura 3.12 se muestra una gráfica de este resultado. En donde se pue-


den ver dos ramas de la curva w en función de k, una para el caso en que se tome
el signo + y la otra, el signo -, en (3.4-9). La rama superior, w+(k), se conoce con
el nombre de óptica, en tanto que la inferior, w_(k), se denomina la rama acústica.
La importancia de esta terminología se aclarará más detalladamente a su debido
tiempo. Para valores pequeños de k, sen ka:::: ka, y las dos raíces se convierten en

(3.4-10)

w_(k)=ka J --
m+M
2p
(ka ~ ;r/2). (3.4-11)

Para obtener la expresión (3.4-11) se debe escribir la raíz cuadrada de (3.4-9)


en forma de una expansión binomial para valores pequeños del argumento.
La longitud de onda más pequeña posible de la primera zona de Brillouin es
dos veces la distancia de la celda unitaria de la red que, en este caso, es 2a. Esto
proporciona una longitud de onda mínima de 4a, correspondiente a un valor má-
ximo de k de Tr/2a en la frontera de la primera zona. Para este valor de k (3.4-9) da
Región de frecuencia prohibida 65

y (3.4-12)
w_ = )l/3/M.

Las características físicas del movimiento se pueden entender mejor, obser-


vando lo que sucede cuando k~ O. En este caso, para obtener la relación de la
amplitud B/A la expresión (3.4-5) es la más conveniente, siendo el resultado

, U2n+ 1 B 2{3
(3.4-13)
!~~~=A= 2{3- Mw~

Para la rama acústica, w = w_, como se indica en (3.4-11) y conforme


k~ O, w_ ~O, de donde B/A = l. En consecuencia, para el modo acústico de vibra-
ción, los dos tipos de átomos se mueven en la misma dirección, con igual amplitud,
como se muestra en la figura 3.13(a).

(a) Rama acústica

(b) Rama óptica

Figura 3.13. Desplazamientos físicos asociados con vibraciones de longitud de onda larga pro-
pios de (a) la rama acústica y (b) la rama Óptica.

Para 1~ rama óptica, w = w+ en (3.4-13) y utilizando (3.4-10) se ve claramente


que, en este caso, B/A = - m/M. Por tanto, para la rama óptica en k= O, las
vibraciones de los átomos tienen direcciones opuestas y las amplitudes, una relación
inversa con las masas, de manera que el centro de la masa de la celda unitaria
permanece fijo durante el periodo de movimiento, como se observa en la figu-
ra 3.13(b). Por lo general, esas características son típicas de las ramas óptica y
acústica. Las vibraciones de modo óptico en cristales iónicos, donde dos tipos de
átomos tienen cargas opuestas, se pueden excitar mediante un campo eléctrico que
tiende a hacer que los iones se muevan en diiecciones contrarias. Sobre todo en las
substancias iónicas, este modo se puede excitar mediante un campo eléctrico asocia-
do con una onda lumínica, debido a lo cual se usa el término de vibraciones de
modo óptico.

3.5 REGION DE FRECUENCIA PROHIBIDA

De acuerdo con la mencionada figura 3.1 '2, existe una banda de frecuencias
2(3/M < w 2 < 2(3/m en la que no hay soluciones de la forma (3 4-2). Pues sucede que
las frecuencias de este rango simplemente. no pueden propagarse como vibraciones
armónicas continuas no amortiguadas de la red. Si se intenta excitar vibraciones de
una frecuencia que queda dentro de esta banda. las vihmciones ~on at<'lllltlllas o
66 Dinámica de redes cristalinas

amortiguadas por la propia red, dependiendo el coeficiente de atenuación de la


frecuencia, las masas atómicas y la constante de fuerza.
Para ver esto con mayor claridad, la ecuación (3.4-7) se puede escribir en la
siguiente forma

(3.5-1)

Puesto que en la regwn 2(3/M < w 2 < 2(3/m, el primer factor en la parte supe-
rior de la ecuación de (3.5-1) es positivo y negativo el segundo, es evidente que
cos ka debe ser imaginario en esta región de frecuencias, por lo que ka debe ser un
número complejo. Si la raíz cuadrada se escribe en la segunda forma que se indica
arriba, cos ka se expresa como una cantidad imaginaria if>, en donde 6 es un número
real dentro del rango de frecuencias de interés.
El coseno de un número complejo se puede expresar como la suma de partes
reales o imaginarias mediante un simple cálculo, utilizando el teorema de Euler como
sigue:

COS Z = COS (x + iy) = COS X COSh y- Í sen XSenh y. (3.5-2)

Si esto se iguala a if>, como lo requiere (3.5-1), y se igualan las partes reales e
imaginarias de la ecuación resultante, se obtiene

cos x cosh y = O, (3.5-3)

sen x senh y= -~. (3.5-4)

En (3.5-3), coshy no es nunca cero para cualquier valor de y, de donde


cos x = O y x = ± rr/2, por tanto, sen x = ± l. Al substituir este valor en (3.5-4), es
obvio que

y = :¡: senh- 1 ~. (3.5-5)


en donde,
7l
z = ka = x + iy = ± l + i senh- 1 e) (3.5-b)

y las soluciones de la ecuación de onda (3.4-2) se convierten en

(3.5-7)

Estas son oscilaciones atenuadas o amortiguadas; el signo menos del exponente


se debe seleccionar para los casos físicamente reales de-ondas amortiguadas (el signo
m:ís representa ondas crecientes cuya amplitud aumenta exponencialmente a lo largo
Excitación óptica de vibraciones reticulares en cristales iónicos 67

de la cadena). La constante de atenuación K, definida al escribir la solución (3.5-7)


como

(3.5-8)
está dada por

1
K=- senh - l ó, (3.5-9)
a

en donde o, a su vez, está dada por (3.5-1). Esta misma situación general predomina
para valores de w que exceden w+(O), según han sido dados por (3.4-1 0), y también
en el caso de la cadena monoatómica para valores de w que se sobrepasen de
y4[3/m; en cada caso se encuentra que la red cristalina no puede propagar frecuen-
cias en estos rangos y que la red misma debe amortiguar o atenuar cualquier pertur-
bación de esta índole.
Hasta ahora sólo se han visto ondas longitudinales en redes unidimensionales;
sin embargo, también se pueden excitar vibracwnes transversales en las que los des-
plazamientos atómicos son perpendiculares a la cadena y no a lo largo de ella. Las
características de estas ondas transversales son, en general, muy similares a las de las
ondas longitudinales; el fenómeno de dispersión, los modos de vibración acústico y
óptico para las estructuras diatómicas y las bandas de frecuencias prohibidas, se
producen más o menos en la misma forma que en las ondas longitudinales. Puesto
que las ondas transversales implican desplazamientos atómicos normales a los que
tienen lugar en las vibraciones longitudinales, las ondas transversales y longitudinales
se pueden excitar en forma simultánea (como primera aproximación) e independien-
temente entre sí. De igual manera, puesto que existen dos direcciones posibles de
desplazamiento ortogonal e independiente para las ondas transversales, se pueden
excitar de un modo simultáneo dos oscilaciones transversales independientes.

3.6 EXCITACION OPTICA DE VIBRACIONES RETICULARES


EN CRISTALES IONICOS

En un cristal iónico, por ejemplo, el de NaCl, los átomos de sodio y cloro


están ionizados; el átomo de sodio lleva una carga e y el de cloro una carga -e. En
estos cristales, el vector eléctrico de una onda lumínica puede excitar vibraciones de
un modo óptico, ya que un campo eléctrico ejerce fuerza sobre las cargas positiva
y negativa que tienen direcciones opuestas. En esta exposición, se supondrá que se
trata de redes diatómicas lineales de átomos de cargas opuestas que se extienden a
lo largo de la dirección x y que la luz incide perpendicularmente a la cadena
atómica, de tal modo que el vector eléctrico de la onda oscila a lo largo del eje x. En es-
tas condiciones, en cualquier instante dado, todos los átomos del cristal están sometidos
al mismo campo eléctrico, y sobre los iones adyacentes, positivos y negativos, se
ejercen fuerzas exactamente iguales, pero opuestas. El efecto que produce un campo
de excitación de esta naturaleza consistirá en establecer vibraciones longitudinales
forzadas en la red cristalina, a la frecuencia de la fuente de excitación, es decir, la
onda de luz incidente. Puesto que el campo eléctrico es idéntico en todas las partes
de la red, en un momento dado, el tipo de vibración que se excitará será el de la
figura 3.13(b), o sea, una vibración óptica de una longitud de onda infinitamente
larga, en la que k = O.
68 Dinámica de redes cristalinas

En presencia de este tipo de campos, la fuerza ejercida sobre un ion positivo


es eE0 eíwot y en el ion negativo, -eE0 eiwot, en donde w 0 es la frecuencia de la luz
y E 0 es la magnitud del vector eléctrico de la onda de luz. De acuerdo con esto, se
debe agregar un término de fuerza eE0 eiwot al lado derecho de la primera ecuación
de movimiento (3.4-1) y el término - eE0 eiwot al segundo. Si ahora se suponen
soluciones de la forma

(3.6-1)
u 2n+ 1 = Bei(coor-[2n+ 1JkaJ

Las vibraciones que se han supuesto a la frecuencia de fuerza y, si se repiten los


pasos que llevan a las ecuaciones (3.4-4), se obtiene

- mw~u2n = p[(l + éika)u2n+ 1 - + eE0 eiwot


2u2nJ
(3.6-2)
- 2 R[(l +e - 2ika) U2n- 2U2n+1 J -eE oeiwot·
M WoU2n+1=P

Puesto que desde el punto de vista físico la vibración óptica que se excita por
medio de la onda de luz es tal que k= O, el conjunto de ecuaciones anteriores se
reduce a

(2P- mw~)u 2 n- 2Pu2n+1 = eEoeiwor


(3.6-3)
-2Pu2n + (2P- Mw~)u2n+1 = -eEoeiwor.

Este grupo de ecuaciones simultáneas se puede resolver para las amplitudes de


vibración u 2 n y u 2 n+l, y el resultado es

- (- eEo/m) iwor
U2n- Wo-
2
w+2(0)e
(3.6-4)
_ (eEo/M) iw 0 t,
U2n+ 1 -
w 02 -w+2 (O) e

en donde w+{O) es el límite de longitud de onda larga de la frecuencia de rama


óptica, como está dado por (3.4-10).
De acuerdo con estos resultados, cuando la frecuencia de la luz incidente es
igual a la frecuencia natural de la red para vibraciones de modo óptico de longitud
de onda larga, w+{O), por lo normal, se observaría un efecto de resonancia ya que
las amplitudes de vibración aumentarían mucho. Es de esperarse que al producirse la reso-
nancia, las amplitudes muy grandes de vibración de los iones cargados den origen a una
fuerte rerradiación de energía electromagnética a la frecuencia resonante. De hecho,
este fenómeno se observa en cristales iónicos en los que se produce un solo pico
fuerte en la reflexividad óptica del cristal en la región infrarroja lejana del espectro,
sobre todo en la región de 40 a 1OOJ.L de longitud de onda. Si se conocen las
constantes de elasticidad del cristal, se puede hacer un cálculo de la constante de
fuerza {3; sí luego se conocen las masas atómicas m· y M, se puede calcular y
comparar la frecuencia de resonancia w+(O) según la predice (3.4-1 O), con la fre-
cuencia óptica a la que se observa experimentalmente la máxima reflexividad. De
esta manera se encuentra que en la mayoría de los cristales iónicos simples, los dos
valores concuerdan con bastante exactitud.
Energía de enlace de estructuras cristalims iónicos 69

Si un cristal iónico dado refleja varias veces la radiación de una fuente infra-
rroja de espectro continuo, la radiación residual resultante será una luz casi mono-
cromática de la frecuencia de resonancia de la red, ya que a otras frecuencias, la
reflexividad del cristal será más bien pequeña y, después de varias reducciones, este tipo
de luz se atenuará enormemente. Este efecto ha llevado a la terminología de rayos resi-
duales o bien, como se dice en alemán, Reststrahlen, refiriéndose a la radiación refle-
jada desde un cristal iónico al pico de reflexividad. El efecto característico de Reststrahl,
según se produzca o no, puede indicar si el cristal es iónico o bien covalente, ya que el
modo de vibraciones ópticas no se puede excitar así en un cristal covalente, eP el que
los átomos no llevan una carga neta. La intensidad del pico de Reststrahl en un cristal
mixto iónico-covalente, también proporciona una estimación cuantitativa de la fuerza
relativa del componente iónico del enlace del cristal.
Por supuesto, en relación con el pico de reflexividad, se tiene un mínimo en la
transmisión óptica del cristal. Aunque en el cálculo sencillo que se hizo se pasaron
por alto los términos de amortiguamiento en la ecuación del movimiento, y no se
incluyó ningún otro para explicar las pérdidas de energía del cristal, en realidad, sí
se registra una pérdida de energía. Esta pérdida se debe no sólo a la rerradiación del
haz reflejado, sino también a otras razones entre las cuales la más importante es la
de la inarmonía de las vibraciones reticulares que se origina a las amplitudes grandes,
producidas cerca de la resonancia, originando, a su vez, la excitación de otros modos
de vibración de la estructura reticular.

3.7 ENERGIA DE ENLACE DE ESTRUCTURAS


CRISTALINAS IONICAS3

En un cristal iónico, las fuerzas que mantienen unido el cristal se ongman


principalmente en interacciones electrostáticas simples entre los iones positivos y
negativos del cristal. Para este tipo de enlace, es bastante sencillo calcular la energía
de enlace de la red cristalina sobre una base semiempírica. El planteamiento original
de este tema se debe a Madelung y Born. 4 ,S,6
A continuación se verá el ejemplo específico de un cristal de la estructura del
NaCl, como se ilustra en la figura l. 7(a); U¡¡ es la energía potencial de interacción
entre los iones i y j del cristal. El total de energía de interacción entre el ion i y
todos los demás iones del cristal es, entonces,

(3.7-1)

La prima de la suma indica que el término para el que j = i se debe excluir de


la suma, ya que evidentemente, no existe una interacción de enlace entre el ion i y
él mismo. Además de la energía coulómbica de interacción ± e2 jr¡¡, en donde r¡¡ es
la distancia entre los iones i y j, se debe suponer q•1e existe una fuerza de repulsión
la cual crece sólo en distancias interiónicas muy pequeñas. En efecto, esta fuerza de
repulsión de corto alcance se origina debido a que cuando los átomos están cerca,

3 Esta sección sigue, en forma general, el planteamiento que le dio C. Kittel en IT'troduc-
tion to Solid State Physics, John Wiley & Sons, Nueva York (1956).
4 E. Madelung, Physik, Zeitschr, 11, 898 (1910).
S M. Born, Atomtheorie des Festen Zustandes, Teubner, Leipzig (1923).
6 M. Born y M. Goppert-Mayer, Handbuch der Physik, 24/2, 623 (1933).
70 Dinámica de redes cristalinas

resisten cualquier intento adicional para obligarlos a ocupar el mismo espacio. Si no


existiera esta fuerza, el cristal tendría siempre una energía coulómbica de atracción neta
entre iones de cargas opuestas, que sería mayor que la energía coulómbica de repul-
sión entre iones de cargas iguales, y el cristal simplemente se derrumbaría reducién-
dose a un volumen igual a cero. La energía de interacción entre los iones i y j
debida a esta fuerza, se representa empíricamente mediante el término A/1/¡. Si el
exponente n es un número razonablemente grande, esta interacción de repulsión será
muy pequeña a grandes distancias y se hará apreciable sólo en espaciamientos in-
teratómicos bastante reducidos.
La energía total de interacción entre los dos iones i y j, se puede expresar
como la suma de las interacciones de repulsión de Coulomb y de corto alcance, en
la forma

(3.7-2)

Se debe observar que la fuerza originada en la interacción de repulsión a corto


alcance, está dada por la derivada negativa de la energía de interacción correspon-
diente con respecto a r¡¡, nA/1¡}+ 1 • En (3.7-2) el signo + se aplica a interacciones
entre iones de signos iguales y el signo - se refiere a las interacciones entre iones de
cargas opuestas. La constante A se limita a expresar la proporcionalidad entre la
energía de repulsión a corto alcance y rij 11 • Si el cristal se considera como un elemen-
to compuesto de N iones positivos y N iones negativos, la energía total de enlace de
la red, U, se puede expresar como sigue:

U=NU;. (3.7-3)
Ahora bien, el número total de iones del cristal es 2N, pero, al determinar la
energía total de enlace, sólo debe tomarse una vez la energía aportada por cada par
de interacciones ij; si se escribiera (3.7-3) con un factor de 2 en el lado derecho, las
interacciones U¡¡ y U¡¡ de (3.7-1) se hubieran contado erróneamente como si fueran
entidades independientes. La energía U¡¡ dada por (3. 7-2), viene a ser la suma de la
energía necesaria para separar los iones i y j situados a una distancia inicial r¡¡, hasta
que estén infinitamente separados; la energía reticular total U es, entonces, la ener-
gía requerida para convertir un cristal cuyos átomos vecinos más cercanos se encuen-
tran inicialmente a una distancia r, en iones separados, cada uno de los cuales está
infinitamente lejos de los demás.
Si ahora las cantidades X¡¡ que no tienen dimensiones se definen en tal forma
que

(3.7-4)

en donde r es la distancia entre los átomos adyacentes del cristal, entonces, (3. 7-2)
se puede expresar como sigue:

(3.7-5)
y

(3.7-6)
Energía de enlace de estructuras cristalinas iónicas 71

No obstante, en (3.7-6), r es ahora independiente del índice de suma j, por lo


que

A , 1 e2 1
U-(r)
1 n¿ - n+-
= -"" - ""'-
¿ ' (3.7-7)
r i X¡i r i xii

que se puede escribir así:

B ae 2
U-(r)=....!! _ _ (3.7-8)
' r" r '
con

B" = A L' 1/x'& (3.7-9)


j

y
a = L.' + 1/xii. (3.7-10)
j

En la figura 3.14 se muestra una gráfica de la relación (3.7-8), dando a U¡


como una función de la distancia al átomo más cercano r. Si la distancia entre los

U; (r)

r =o (Separación del ion en equilibrio)

7::7
:;."
:í'
'/'
/
U; (o)+--........::~_.,1 Energía de Coulomb- ae 2/r
(Energía de enlace) 1
1
1
Figura 3.14. Energía potencial de un ion de un cristal iónico en función de la distancia in-
teratómica r. El cristal está en equilibrio cuando dicha energía está en un mínimo,
o sea cuando existe una separación interatómica igual a la distancia reticular de
equilibrio a.

átomos adyacentes es grande, la repulsión de alcance corto se puede omitir y la


energía de enlace es esencialmente el exceso de la energía coulómbica de atracción,
que se acerca a cero conforme r tiende a infinito. A distancias más cortas, la ener-
gía positiva de repulsión de corto alcance adquiere importancia y sobrepasa la energía
negativa de Coulomb, aumentando con gran rapidez conforme disminuye r. Existe
72 Dinámica de redes cristalinos

una posición de energía mínima para el sistema, como lo indica el diagrama, y este
punto representa la posición de equilibrio del cristal. El valor de r asociado con
este punto es, sencillamente, la distancia interatómica de equilibrio a del vecino más
cercano. En este punto, la fuerza coulómbica de atracción entre los iones mantiene
un difícil equilibrio debido a la repulsión de corto alcance, siendo igual a cero la
fuerza neta ejercida sobre un átomo, dada por - au;;ar.
La constante a de la ecuación (3.7-8) que se denomina constante de Madelung,
es un número que está determinado completamente por la estructura reticular del
cristal. La constante B depende del coeficiente de energía de repulsión A, así como
de la estructura reticular. Sin embargo, se puede determinar en términos de la
distancia de equilibrio a del vecino más cercano. Para hacer esto, se debe evaluar la
derivada de U;(r), a r =a que, de acuerdo con la exposición anterior, debe ser igual
a cero, ya que el punto mínimo de la curva de energía potencial se produce a r = a
Por tanto, se tiene que

nBn cxe 2
- n:tr
a
+ -a2 = O,
de donde,

(3.7-11)

Al substituir este valor de Bn en (3. 7-8), si se usa (3. 7-3) se encontrará que
para la energía total de enlace en equilibrio,

U0 = NU¡(a) = - -Ncxe
2
a - ( 1- ~ . 1) (3. 7-12)

En esta fórmula no se conoce inicialmente a o n. No obstante, en principio, se


puede calcular a evaluando la suma (3. 7-10) en todos los átomos del cristal. En esta
ecuación, el signo superior se refiere a las interacciones entre cargas iguales y el
signo inferior, a las interacciones entre cargas opuestas. Por tanto, si el origen se
escoge como un punto de ion negativo, el signo positivo de (3.7-10) corresponderá a
las interacciones con iones positivos y el signo negativo a las interacciones con iones
negativos. Para una cadena unidimensional de átomos cargados, alternados, en donde,
cada átomo está separado de sus vecinos por una distancia a, se tiene que, al escoger
un ion negativo como origen y al usar (3.7-10),

(3.7-13)

El factor 2 es necesario porque las cantidades aportadas por los átomos a la


izquierda del origen y por los átomos a la derecha del mismo, se deben incluir
igualmente en la suma. De acuerdo con la expansión de serie,

x2 x3 x4
In (1 + x) = -x- -
2
+---
3 4
+ ··· (3.7-14)

la serie de (3.7-13) se puede obtener haciendo que x = l, de donde, para este caso,

ex= 2ln 2. (3.7-15)


Energía de enlace de estructuras cristalinas iónicas 73

La evaluación de la constante de Madelung resulta un ejercicio fácil para este


ejemplo sencillo. Sin embargo, cuando estos mismos métodos se aplican a estructuras
cristalinas reales de tipo tridimensional, se descubre que la suma converge en forma
tan lenta que es muy difícil evaluar a directamente en esta forma. Resulta ilustrativo
escribir la suma de Madelung para los vecinos más cercanos, los que le siguen en
segundo lugar, en tercero, etc., para la estructura del NaCl, con el fin de demostrar
la naturaleza de estas dificultades de convergencia. Existen varios patrones matemá-
ticos que se pueden utilizar para contrarrestar estas dificultades, el mejor de los
cuales ha sido creado por Evjen 7 y Ewald. 8 En esta obra no se entrará en los
detalles de estos métodos, sino que sólo se mencionarán los resultados correspon-
dientes a algunas estructuras de interés. Se ha encontrado que para la

estructura de NaCl oc= 1.7476


estructura de CsCl 1.7627
estructura de la zincblenda 1.6381

La tendencia de los compuestos iónicos a cristalizar en estructuras que poseen


constantes de Madelung grandes es por demás conocida. Esto se debe a que un valor
máximo de a, de acuerdo con (3.7-12), minimiza la energía del sistema dando un
cristal con la máxima energía de enlace (negativa). En consecuencia, los cristales
muy iónicos raramente cristalizan en estructuras como la de la zincblenda.
La constante n de (3. 7-12), que es en realidad el exponente asociado con el
potencial de repulsión a corto alcance, se puede expresar en términos de la compre-
sibilidad adiabática del cristal, que se puede medir en forma experimental. Para hacer
esto, se puede comenzar con la Primera Ley de Termodinámica que establece que

dQ = dU + p dV = T dS, (3.7-16)

en donde los símbolos tienen su significado termodinámico acostumbrado. Se consi-


dera que la energía interna U se compone totalmente de la energía potencial de
interacción entre los iones del cristal, según se expresa en (3.7-12). Esto significa
que se supone que la temperatura es mucho menor que la de fusión en una escala abso-
luta, ya que al aumentar la temperatura, los iones adquieren, además de su energía po-
tencial, cada vez más energía cinética de vibración, que al llegar al punto de fusión exce-
de la energía potencial de interacción entre los iones y con ello se destruye la estabi-
lidad de la estructura reticular. En el caso de un proceso adiabático, dQ = O, en
donde dS = O y dU = - p dV, dando

p = -(dU) y (3.7-17)
dV S

La compresibilidad adiabática (compresibilidad medida en tales condiciones que no


se intercambie calor con el medio), se puede definir como

K=_.!._ (dV) (3.7-18)


V dp .'

7 H. M. Evjen, Phys. Rev. 39, 675 (1932).


8 P. P. Ewald, Ann.d.Physik 64, 253 (1921).
74 Dinámica de redes cristalinas

en cuyo caso, de acuerdo con (3.7-17),

.!.= -v(dp) =v(dz~)-


K dV • dV •
(3.7-19)

De igual manera,
dU dU dr
dV=drdV
y

_ dU d 2 r
- dr dV 2 +
(!!!:)
dV
2 d2 U
dr 2 • .
(3.7-20)

Sin embargo, el volumen de la celda unitaria de NaCl, con 4 átomos de Na y


4 átomos de Cl, como se ilustra en la figura 1.7(a), es 8r3 ; el volumen por átomo
de Na (o por átomo de Cl) es, por tanto, 2r 3 , y el volumen total de un cristal
grande con N iones de Na y N iones de Cl, será

(3.7-21)

de donde,
dr 1
(3.7-22)
dV = 6Nr 2

(3.7-23)

De acuerdo con (3.7-20), (3.7-22) y (3.7-23), se tiene que

d2U -1 dU 1 d2U
(3.7-24)
dV = 18N 2 r 5 dr
2 + 36N 2 r4 dr 2 '

Como ya se vio antes, dU/dr =O a r =a, por tanto, de acuerdo con (3.7-24),
se de be tener

(3.7-25)

de donde, recordando (3.7-19)

(3.7-26)
Energía de enlace de estructuras cristalinas iónicas 15

A partir de (3.7-8), U(r) se puede expresar como sigue:

2
B a.e ]
U(r) = NU¡(r) = N [ ; ---¡: , (3.7-27)

en donde,

(3.7-28)

Bn está dada por (3.7-11). Al substituir Bn de la última ecuación, en (3.7-28),


y simplificando, haciendo que r =a, se obtiene finalmente,

Na.é(n- 1) 18Na
a3 =~· (3.7-29)

de donde, resolviendo para n,

18a 4
n = l + - -2 • (3.7-30)
Ka.e

Para el NaCl, el valor medido de la compresibilidad adiabática k, es aproximada-


mente 4 x I0- 12 cm 2 /dina, en tanto que a= 2.8 x I0- 8 cm. Cuando se substituyen
estos valores en la expresión (3. 7-30), se obtiene el resultado n e:: 8, por lo que en
este caso, de acuerdo con (3.7-12), se debe esperar que U0 e:: -0.9Nae 2 ja. Entonces,
parecería que aproximadamente el 90 por ciento de la energía de enlace de la red
está representado por el primer término de (3.7-12), que simboliza el exceso de
energía de atracción coulómbica entre iones de cargas opuestas, en relación con
la energía de repulsión de Coulomb entre iones de cargas iguales, en tanto que el
segundo término, que representa la parte aportada de repulsión a corto alcance,
constituye sólo aproximadamente el 1O por ciento del total. El hecho de que n
resulta ser un número bastante grande, coincide con las suposiciones originales rela-
cionadas a la forma del potencial de repulsión a corto alcance y, en efecto, sirve
para validar hasta cierto punto dichas suposiciones.
La energía de cohesión de casi todos los cristales altamente iónicos de tipo
I-VII calculados así a partir de (3.7-12) y (3.7-30), concuerdan muy bien con los
valores determinados de un modo experimental, como se indica en la tabla 3.1. 9
Esta coincidencia con el experimento no es tan buena en el caso de los compuestos
completamente iónicos II-VI, como podría esperarse. Se debe tener en cuenta el
hecho de que estos cálculos son, hasta cierto grado, empíricos, y que relacionan un
conjunto de cantidades determinadas en forma experimental (espaciamientos reticula-
res y compresibilidad) con otras (exponentes del potencial de repulsión y energía de
enlace). Un cálculo verdaderamente fundamental de la energ:a de enlace del cristal,
se etectuará a partir del conocimiento de las propiedades mecánicas ondulatorias de
los iones positivos y negativos, y predeciría más que utilizaría, los valores de la
constante de red y las compresibilidades; las únicas cantidades medidas que aparece-
rían en una formulación de esta clase serían e, m, h, etc. Lowdin 10 llevó a cabo

9 Los valores aquí citados fueron tomados de F. Seítz, Modern Theory of Solids, McGraw-
Hill, Nueva York (1940), tablas XXIV y XXVI, páginas 80-83.
10 P. Lowdin, Ark.Mat. Astron. Fysik 35A, Nos. 9, 30 (1947).
76 Dinámico de redes cristalinas

TABLA 3.1.
Energías de enlace teóricas y experimentales
de cristales iónicos

Uo (cale.) U0 (exp.) Exponente


Substancia kcal./mol kcal./mol de repulsión, n

LiCI 193.3 198.1 7.0


NaCI 180.4 182.8 8.0
KCI 164.4 164.4 9.0
RbCI 158.9 160.5 9.5
CsCI 148.9 155.1 10.5
NaBr 171.7 173.3 8.5
KBr 157.8 156.2 9.5
N al 160.8 166.4 9.5
KI 149.0 151.5 10.5
Rbl 144.2 149.0 11.0
ZnS (Zincblenda) 819.0 851.0 9.0
ZnSe 790.0 845.0 9.5
PbS 705.0 731.0 10.5
PbSe 684.0 735.0 11.0

cálculos de este tipo, cuyos resultados concuerdan bastante con el experimento. Sin
embargo, el análisis detallado de este tema está fuera del alcance de esta obra.
A pesar de todo, la teoría más sencilla de Born-Madelung tiene un valor considerable,
debido a que verifica el simple modelo conceptual del enlace iónico con el que
principiamos y porque permite que se entienda con facilidad el papel que desem-
peñan las fuerzas de repulsión Coulomb y de corto alcance en la determinación de
la energía de enlace en las substancias iónicas.

EJERCICIOS

l. Para la red lineal monoatómica de la sección 3.3, encuentre el coeficiente de atenuación


de ondas de frecuencias mayores que Y4fJ!m.
2. Derive la ecuación de movimiento para ondas transversales en la red monoatómica lineal
de la sección 3.3. Compare sus resultados con la ecuación de movimiento para ondas longitudi-
nales.
3. Determine la velocidad de fase y la de grupo para ondas de las ramas óptica y acústica,
para la red diatómica de la sección 3.4. Grafique sus resultados en función de k.
4. La red de la zincblenda se puede considerar como una serie de planos (111) con
espaciamiento alternado a, a/3, a, a/3, a, a/3, • • • , en donde a es 1/4 del lado de una celda
unitaria cúbica. Cada plano contiene átomos de un solo tipo, de modo que los espacios atómicos
en planos sucesivos son alternados: Zn, S, Zn, S, Zn, • • • . Los planos se mantienen unidos alter-
nativamente mediante un enlace covalente por átomo, normal al plano (111), y 3 enlaces de este
tipo por átomo a un ángulo con la dirección [111] cuyo coseno es 1/3, de tal modo que se
utiliza la misma cantidad de fuerza por unidad de desplazamiento para estirar un solo enlace o
un sistema de tres enlaces dispuestos a este ángulo, cuando un átomo se desplaza a lo largo de
la dirección angular [111]. Estudie la red diatómica del tipo que se ilustra en la figura que sigue,
con una constante de fuerza {3 que es la misma para cualquier desplazamiento, y luego defina y
resuelva las ecuaciones de movimiento para ondas longitudinales en la dirección (111) en la
zincblenda, y grafique la relación resultante de w en función de k en la primera Zona Brillouin.
¿Cuál es el borde de esta primera zona? Nota: para la zincblenda, b =a/3, m =/=M en la fJ.gura
antcri'-;r.
Energía de enlace de estructuras cristalinas iónicas 11

m M m M

Zn-3 2n-2 2n-l


tf
2n 2n+l
tt
2n+2 2n+3

5. Resuelva el problema 4 para obtener las relaciones de w en función de k para ondas


longitudinales en la dirección [111] para la red de diamante. Diga si el hecho de que el
diamante sólo tiene átomos de una especie es la causa de que no existe una rama "óptica" para
esta estructura. Sin entrar en detalles compare resultados obtenidos con los del problema 4.
6. Si el coeficiente de rigidez elástica e para NaCl es 5 X 1011 dinas/cm2, encuentre la
constan te de fuerza {j y calcule la frecuencia de Reststrahl de este cristal.
7. Suponga que las vibraciones longitudinales de una cadena lineal de N átomos idénticos,
se limitan a obedecer las condiciones periódicas de frontera, de tal manera que el movimiento
del primero y el último átomos es idéntico. Encuentre el número de modos normales de vibra-
ción para este sistema.
8. Determine la constante de Madelung para la cadena lineal del problema 4, suponiendo
que los átomos de masa m tienen carga positiva y los de masa M tienen la misma carga; pero
negativa.
9. Suponga que un fluido isotrópico homogéneo con una constante dieléctrica K, se derra-
ma en los espacios interatómicos de un cristal iónico, de tal manera que la interacción coulóm-
bica se reduce por un factor de 1/K. Suponiendo que el potencial de repulsión de corto alcance
no varía, calcule el nuevo espaciamiento reticular y la nueva energía de enlace en términos de la
energía de enlace y el espaciamiento antiguos.
10. Analice las características de reflexión óptica de Ge, CdS, KBr y GaAs en la región
infrarroja lejana del espectro. Finalmente explique sus predicciones desde el punto de vista de la
física.
11. La imposición de condiciones periódicas de frontera a una cadena unidimensional de
átomos, corresponde físicamente al caso en que el principio y el fin de la cadena se unen para
formar un anillo continuo de átomos. ¿A qué sistema físico corresponde una red cuadrada
bidimensional de átomos que obedecen a condiciones periódicas de frontera en los bordes opues-
tos de la red? Explique el significado topológico de una red cúbica tridimendional que obedece
a condiciones periódicas de frontera en las caras opuestas de la muestra.

LECTURAS RECOMENDADAS
M. Born y M. Goppert-Mayer, Handbuch der Physik, Vol. 24/2, J. Springer Verlag, Berlín
(1933), p. 623.
M. Born y K. Huang, Dynamical Theory of Crystal Lattices, Oxford University Press, Oxford
(1956).
L. Brillouin, Wave Propagation in Periodic Structures, Dover Publications, Nueva York (1953).
C. Kittel, Introduction to So/id State Physics, 2.a edición, John Wiley & Sons, Nueva York
(1956), capítulo 3.
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 2.
R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 3.
J. M. Ziman, Electrons and Phonons, Oxford University Press, Nueva York (1960), capítulos 1 y 3.
CAPITULO 4
Mecánica cuántica.
Generalidades

4.1 INTRODUCCION

Durante los últimos años del siglo diecinueve y los primeros del presente, los
científicos se encontraron con un gran número de hechos observados en su experi-
mentos que no se podían explicar debidamente basándose en la mecánica y la
electrodinámica clásicas. Entre los fenómenos poco comprendidos se incluían algunas
de las propiedades térmicas y eléctricas fundamentales de los sólidos. Por ejemplo, el
hecho de que algunos sólidos son muy buenos aisladores, con resistividades específicas
mayores de 10 12 ohm-cm, y otros son conductores excelentes con resistividades del
orden de 10- 5 ohm-cm, no se podía explicar en absoluto desde el punto de vista de
la teoría clásic.-. Sin embargo, a partir de 1901 gracias a la explicación dada por
Max Planck sobre la distribución espectral de radiación proveniente de cuerpos ca-
lientes incandescentes, se pudo demostrar que casi todos estos resultados expe-
rimentales hasta entonces inexplicables, demostraron estar de acuerdo con las pre-
dicciones de una nueva mecánica la cual difiere en muchos aspectos importantes de
la mecánica newtoniana, aunque concuerda con ella en el límite en que las masas y
las energías de las partículas se hacen relativamente grandes. Esta nueva y ampliada
forma de la mecánica, que resultó especialmente útil en la descripción de aconteci-
mientos que se desarrollan a una escala atómica, se denominó mecánica cuántica.
Aunque es imposible presentar en esta obra una relación extensa sobre el tema, se
analizarán algunos de sus aspectos más importantes, a fin de proporcionar al lector
los conocimientos necesarios para resolver problemas dinámicos simples desde el pun-
to de vista de la mecánica cuántica, y para apreciar los resultados de los cálculos
concernientes a sistemas más complejos que se dan más adelante, al explicar el
comportamiento físico de cristales reales.

4.2 RADIACION DEL CUERPO NEGRO

En la figura 4.1 se ilustra la distribución espectral de la intensidad de radia-


cwn emitida por un radiador incandescente ideal, llamado "cuerpo negro" detemli-
nada experimentalmente. Hacia fines del siglo pasado, se realizaron varios intentos
para explicar estos resultados a base de la mecánica clásica y la teoría electromag-
nética, tratando al campo de radiación como si fuera un fluido con propiedades

79
80 Mecánica cuántica. Generalidades

termodinámicas tales como temperatura, presión, entropía, etc., que se determinaban


mediante las leyes de la electrodinámica y la termodinámica clásicas Se supuso que
este fluido estaba en equilibrio con los átomos de la substancia radiante y éstos se
consideraban como osciladores armónicos dásicos. Ninguno de estos intentos tuvo
éxito para describir la parte de las curvas, correspondiente a longitudes de onda
corta, aunque se obtuvieron coincidencias aceptables con los datos experimentales en
el límite o sea, para las longitudes de onda largas (la Ley de Rayleigh-Jeans). Los
cálculos clásicos que se basaron siempre en la idea de que los osciladores atómicos
podían absorber o emitir continuamente energía en cualquier cantidad, grande o
pequeña, predijeron invariablemente intensidades espectrales infinitas en el límite de
las longitudes de onda corta. Esto dio como resultado la emisión de una energía de
radiación total infinita por unidad de tiempo, lo cual constituye un resultado obvia-
mente absurdo.

3000 °K

I(X)

o 1 2 3
x (micrones)

Figura 4.1. Representación esquemática de la distribución de frecuencia de la radiación emitida


por un radiador incandescente ideal o "cuerpo negro" a varios valores diferentes de
temperatura.

En 1901, Max Planck logró explicar la forma de las .curvas de intensidad de


radiación espectral correspondientes a la radiación de un cuerpo negro, formulando
la hipótesis de que los osciladores atómicos podían radiar o absorber energía sólo en
paquetes o grupos discretos (denominados fotones) cuya energía está dada por

e= hv = nw, (4.2-1)

en donde,
n = hj2n. (4.2-2)

En este caso, v es la frecuencia del oscilador (o de la radiación absorbida o


emitida), w = 2nv, y h es la constante atóm1ca universal (constante de Planck) de
magnitud

h = 6.625 x 10- 27 erg-sec

n = hj2n = 1.054 X 10- 27 erg-sec.


Efecto fotoeléctrico 81

Así pues, se supone que los osciladores poseen sólo ciertos estados de energía permi-
sibles de una energía total O, líw, 2líw, 3líw, • • • nlíw, • • • , en donde las transicio-
nes entre estos estados permisibles se efectúan mediante la absorción o emisión de
fotones cuya energía es líw.
A ciertos científicos de esa época, la hipótesis cuántica les pareció muy ex-
traña, ya que estaban acostumbrados a las ideas de la mecánica clásica; pero la
coincidencia que se obtuvo a partir de entonces con los datos experimentales fue
excelente y el valor de h que usó Planck para lograr que su teoría concordara con
los datos experimentales (6.55 x I0- 27 erg-seg), es solamente uno por ciento menor
del valor que en la actualidad se acepta como correcto. Además, es muy importante
observar que los éxitos subsecuentes de la teoría cuántica para explicar fenómenos
muy diferentes, no dejaron ninguna duda respecto a su validez esencial. A la luz de
los conocimientos actuales, no es difícil aceptar el hecho de que la energía, al igual
que la materia, puede estar compuesta de partículas discretas e indivisibles.

4.3 EFECTO FOTOELECTRICO

Cuando se deja que la luz caiga sobre la superficie de un metal, éste puede
expulsar electrones hacia un vacío, en donde los puede recoger un ánodo, como se ilustra
en la figma 2.4(a). La máxima energía inicial de estos fotoelectrones emitidos se
puede medir insertando un rejilla entre el fotocátodo y el ánodo, y determinando el
potencial retardador que se debe aplicar entre la rejilla y el cátodo para reducir la
fotocorrriente a cero, como se indica en la figura 4.2{b). Se puede demostrar en
esta forma que, si la luz incidente tiene una frecuencia menor que la de una
frecuencia de umbral dada (¡Jo, no se produce ningún efecto fotoeléctrico en abso-
luto, sea cual fuere la intensidad de la luz. Para una radiación incidente de una
frecuencia mayor que w 0 , los fotoelectrones se· emiten en una can ti dad proporcional

Luz

Anodo colector + Foto corriente


Iluminación interna

Iluminación leve
Fotocátodo metálico

Potencial de rejilla

(o) ( b)

Figura 4.2. (a) Diagrama esquemático del aparato usado para estudiar los efectos fotoeléctricos
en los metaies, (b) una gráfica de la fotocorriente observada en función del poten-
cial retardador para varios niveles de intensidad de la luz incidente.
82 Mecánico cuántico. Generalidades

a la intensidad de la iluminación incidente, haciendo que fluya en el circuito externo


una fotocorriente proporcional a la intensidad de la luz. La máxima energía inicial
de estos electrones, medida por el método del potencial retardador, es estrictamente
proporcional a w- w 0 , en donde w es la frecuencia de la luz incidente.
La existencia de la frecuencia de umbral no se puede explicar a base de la
física clásica, y no fue sino hasta después de 1905, cuando Einstein describió la
naturaleza física del efecto fotoeléctrico basándose en la hipótesis cuántica de
Planck. De acuerdo con la explicación de Einstein, los electrones que están dentro
del metal deben poseer una energía potencial menor que la de los electrones que
están en reposo dentro del vacío, fuera de la superficie metálica; de lo contrario, el
metal podría emitirlos espontáneamente en la obscuridad. Este hecho lleva al cuadro
conceptual de un metal tal como se ilustra en la figura 4.3. Para que los electrones
del metal puedan convertirse en fotoelectrones, deben superar una barrera de energía
potencial de una magnitud de por lo menos ecp 0 • El potencial cp0 , denominado
función de trabajo en vacío, es una propiedad característica del material del cátodo
emisor. De acuerdo con las ideas cuánticas de Planck, la absorción de un fotón cuya
energía es menor que ecp 0 por parte del metal, no puede excitar a un electrón hacia
el vacío, sino que sólo le imparte cierta energía cinética que finalmente se disipará
dentro del metal en la forma de calor por medio de colisiones.
Por otro lado, si el fotón absorbido tiene una energía ecp 0 , puede excitar un
fotoelectrón hacia el vacío con una energía cinética cero y, si la energía del fotón

\
Frecuencia incidente
del fotón "'o' etf>0 111
Fotoelectrón emitido al vacío
Energía con un E.C. cero
f _ ___,
e <Po
_L~~~~~~~~
Electrones
Vacío Metal Vacío

Figura 4.3. Modelo conceptual simplificado de un metal, representado como un pozo de po·
tencial que contiene electrones libres y en el que se basa la teoría de Einstein
sobre los efectos fotoeléctricos.

es mayor que ecp 0 , puede excitar a un fotoelectrón hacia el vacío con un exceso de
energía cinética que puede ser de la magnitud hw - ecp 0 , siendo hw la energía del
fotón incidente. La máxima energía de los fotoelectrones emitidos es, entonces,

(4.3-1)

en donde la frecuencia de umbral w 0 debe estar dada por

W0 = e</> 0 /h. (4.3-2)

Todo esto concuerda con los hechos experimentales que se describieron previa-
mente. Además, la ecuación (4.3-1) predice que la pendiente de la curva que da Em
en función de w, será la constante de valor h. ¡Cuándo esta pendiente se evalúa
basándose en datos experimentales, se encuentra, en efecto, que es una constante y
da un valor de h que concuerda exactamente con el valor derivado por Planck de los
datos experimentales corrrspondientes a la radiación de cuerpo negro! El efecto
Calor específico de los sólidos 83

fotoeléctrico proporcionó así, en unos cuantos años, una confirmación notable de la


teoría cuántica, en un campo muy alejado de su aplicación original.

4.4 CALOR ESPECIFICO DE LOS SOLIDOS

La física clásica considera que un cristal sólido es un conjunto de átomos que


se mantienen unidos en un arreglo periódico por medio de ciertas fuerzas de atrac-
ción. Se supone que los átomos son libres para vibrar alrededor de sus posiciones de
equilibrio bajo el efecto de las fuerzas presentes y, para lograr una primera aproxi-
mación, las fuerzas y los desplazamientos átomicos se relacionaron por medio de la
ley de Hook. Entonces, el efecto de la energía térmica consistiría en hacer que estos
átomos vibraran como osciladores armónicos alrededor de sus posiciones de equili-
brio. Un resultado elemental de la teoría cinética clásica consiste en que si las
energías de un conjunto de osciladores clásicos se distribuyen de acuerdo con la ley
de Boltzmann en equilibrio térmico, la energía promedio de un oscilador es kT para
cada grado de libertad vibratoria, en donde T es la temperatura absoluta y k la
constante de Boltzmann (igual a 1.380 x 10- 16 erg¡oK). En una sección posterior se
verá cómo se derivó este resultado. Entonces, de acuerdo con la física clásica, puesto
que hay tres grados de libertad de vibración independiente, por átomo, se debe
esperar que la energía interna térmica total de un cristal compuesto de N átomos
idénticos sea
U= 3NkT. (4.4-1)
La capacidad calórica a volumen constante, Cv, es por definición, la razón de
aumento de la energía interna por unidad de incremento de la temperatura, medidas
en condiciones de volumen constante o, en este caso.

c. = (oUfoT). = 3Nk. (4.4-2)


De acuerdo con la fórmula clásica (4.4-2), la capacidad calórica debe ser inde-
pendiente de la temperatura. Si en (4.4-2) N es igual al número de Avogadro NA
(igual a 6.025 x 10- 23 mol- 1 ), se puede ver que la capacidad calórica molar de
todos los elementos químicos sólidos debe tener el mismo valor 3NAk, igual o
aproximadamente 6 cal °K-- 1 mol- 1 . Este resultado se conoce como la ley de Dulong
y Petit, y concuerda bastante con el experimento para muchos elementos a la tem-
peratura ambiente y por encima de ésta. A temperaturas bajas, el resultado clásico
no concuerda con l::t experiencia, ya que los datos experimentales indican que la
capacidad calórica se acerca a .;ero, conforme la temperatura tiende a cero en la
escala absoluta, según se indica en la figura 4.4. Por supuesto, estas mismas observa-
ciones generales se aplican al calor específico a volumen constante cv, que se define
sencillamente como

c.= (oU/oT)vfV. (4.4-3)

En 1911, Einstein explicó las discrepancias entre la teoría clásica y la experien-


cia, y en 1912, Debye propuso una explicación más exacta basándose en la teoría
cuántica. De acuerdo con la hipótesis original de Planck, un oscilador armónico
puede poseer sólo ciertos estados de energía discreta que tienen los valores

(4.4-4)
84 Mecánica cuántica. Generalidades

c. ley clásica de Dulong • Petit


3Nk _____ 1_ _______~

Figura 4.4. Datos experimentales típicos· para el calor específico de una substancia sólida, en
función de la temperatura, en comparación con el resultado clásico de Dulong-Petit.

en donde w 0 es la frecuencia clásica del oscilador. Como se verá más tarde, esto da
como resultado un promedio de energía de oscilador diferente del resultado clásico,
y capacidades calóricas que concuerdan con los datos experimentales a todas las
temperaturas. También en este caso, la teoría cuántica ha proporcionado una explica-
ción sencilla de un efecto que no podía analizarse de acuerdo con los métodos
clásicos, siendo también este campo muy distinto del de la aplicación original.

4.5 EL ATOMO DE BOHR

Uno de los aspectos más desconcertantes del comportamiento atómico al que


se enfrentaron los físicos del siglo diecinueve, consistió en los espectros de emisión y
absorción de los elementos. Las líneas espectrales claras y discretas que se observa-
ron, no podían entenderse en absoluto a la luz de la mecánica clásica y la teoría
electromagnética. No obstante, en 1913, Niels Bohr propuso un modelo del átomo
del hidrógeno basado en la hipótesis cuántica de Planck, que describe con precisión
sorprendente las principales características del espectro del hidrógeno atómico.
En el modelo de Bohr, que se basó en el concepto del átomo nuclear pro-
puesto por Rutherford en 1910, se supone que un electrón de masa m y carga -e
se desplaza en un órbita alrededor de un núcleo mucho más masivo, de carga + Ze,
en donde Z es un entero. La introducción del factor Z permite explicar no sólo el
hidrógeno (Z = 1), sino también otros iones parecidos a éste, tales como He+ (Z =
2), u++ (Z = 3), Be+++ (Z = 4), etc., que se componen de un solo electrón y un
núcleo pesado.
De acuerdo con la electrodinámica clásica, las cargas aceleradas siempre irradian
energía, y un sistema como el que propuso Bohr, en donde el electrón está some-
tido siempre a una aceleración central, perdería energía constantemente en forma de
radiación y el electrón giraría en espiral acercándose gradualmente hacia el núcleo.
Sin embargo, Bohr supuso que el electrón podía existir en órbitas estacionarias
alrededor del núcleo sin irradiar energía en absoluto, a condición de que la cantidad
de moPimiento angular relacionada con este movimiento estuviera cuantizada en tal
forma que sólo se tuvieran los valores permitidos nh, en donde n es un entero
positivo. Entoncc~. b~ transiciones entre los estados estacionarios permitidos n y m
El átomo de Bohr 85

se relacionan con la emisión o absorción instantánea de un fotón de frecuencia Wmn


tal que

(4.5-1)
en donde Em es la energía asociada con el estado de la cantidad de movimiento
angular mh y En de energía correspondiente al estado de la cantidad de movimiento an-
gular nh.
Por supuesto, desde el punto de vista de la dinámica, la órbita del electrón
alrededor del núcleo podía ser circular o elíptica; pero para facilitar las cosas, se
supondrá que es circular. Los valores permisibles de la cantidad de movimiento
angular L están restringidos a enteros múltiplos de h, de tal manera que

(n = 1,2,3, ···), (4.5-2)

en donde rn es el radio de la órbita con un momento angular nh y Wn es la


velocidad angular del electrón dentro de dicha órbita. Para una órbita estacionaria, el
radio rn debe ser tal que la fuerza electrostática de atracción entre el electrón y el
núcleo, Ze 2 /r~, es justamente la fuerza centrípeta mvMrn necesaria para mantener al
electrón dentro de la órbita circular, de donde,

(4.5-3)

Las ecuaciones ( 4.5-2) y ( 4.5-3) se pueden resolver ya como ecuaciones simul-


táneas para r n y W 12 , dando

n21i2
r =-- (4.5-4)
" Zme 2
y

(4.5-5)

La energía cinética del sistema, ek> está dada por

_ 1 2 _ 2 2 _
Z l me4
¡;k- "lmv"- !mr"w" - - -2- 2 • (4.5-6)
2n li

La energía potencial eP, es

2 Z2 mé
¡;P = -Ze ft"n = - -2-2-. (4.5-7)
n li
Por tanto, la energía total del sistema es

(n = 1,2,3, ···). (4.5-8)

Como se puede ver, la energía del sistema está limitada a ciertos valores dis-
cretos o niveles de energía correspondientes a n = 1, 2, 3, •••. Si Z = l, el sistema
86 Mecánica cuántica. Generalidades

l Energía •

114'1
~

-
-
¡¡- 11
Serie
de Paschen
•3= 1

Serie
de Balmer

Serie
de Lyman

me 4

Figura 4.5. Niveles de energía del átomo de hidrógeno según lo pll'dlc ho por la teoría de
Bohr. Se indican las transiciones correspondientes a cierta~ lmcas espectrales pro-
minentes.

correspondiente al átomo de hidrógeno y el diagrama de niveles de energía resultante


se ilustra en la figura 4.5. Las transiciones entre los niveles de energía se logran
mediante la absorción o la emisión de un fotón cuya frecuencia está dada por
(4.5-1), correspondiendo cada transición de este tipo a una línea posible del espec-
tro. La teoría de Bohr explica con claridad y precisión el espectro del hidrógeno y
de los iones semejantes a él, y se puede ver que las frecuencias espectrales predichas
y las observadas son muy semejantes.
En la exposición anterior se supuso que las órbitas de los electrones son
circulares. En general, las órbitas pueden ser elípticas y, en efecto, se puede demos-
trar que existen series regulares de órbitas elípticas permitidas que satisfacen la
condición cuántica ( 4.5-2). Sin embargo, estas órbitas elípticas no establecen nuevos
niveles energéticos, sino que sólo representan órbitas para las que la cantidad de
movimiento angular tiene un valor mh en donde m es un entero menor que n, así
pues, el sistema posee una energía En de acuerdo con lo que determine (4.5-8); pero
su cantidad de movimiento angular, aunque sigue siendo un entero múltiplo de h, es
menor que el valor máximo nh que corresponde a una órbita circular. También se ha
considerado que el núcleo está fijo, lo cual es cierto sólo en el límite en que la
relación de la masa nuclear a la electrónica se hace infinita. Para una masa nuclear
finita, el núcleo y el electrón girarán alrededor de un centro común de masa. Este
efecto se explica fácilmente y el resultado es que la cantidad m de las ecuaciones
anteriores se debe substituir por una masa reducida J1 dada por

(4.5-9)

siendo M la masa nuclear. En el caso del átomo del hidrógeno, la masa reducida
difiere de la electrónica en aproximadamente 1 parte por 1850.
La hipótesis .te De Broglie 87

Se hicieron numerosos intentos para generalizar el modelo de Bohr con el fin


de explicar los espectros del helio y átomos más complejos; durante la década que
siguió a la presentación del modelo, todos los esfuerzos fracasaron debido a que no
se encontró una forma sencilla para describir las órbitas. En general, los resultados
de los cálculos hechos no concordaron con la experiencia, ni se logró que la teoría
de Bohr explicara por qué algunas transiciones entre estados electrónicos en átomos
complejos, aparentemente, estaban prohibidas. No obstante, el modelo de Bohr pro-
porcionó por vez primera una explicación simple, coherente y exacta de los espec-
tros de átomos monoelectrónicos así como un marco conceptual que permitía en-
tender ciertos aspectos del comportamiento atómico y que resulta útil incluso hasta
hoy.

4.6 LA HIPOTESIS DE DE BROGLIE Y LAS


PROPIEDADES ONDULATORIAS DE LA MATERIA

En 1924, De Broglie sugirió que a una partícula con cantidad de movimiento


p, se le podría asociar una onda de longitud de onda A tal que
h h 2n
p = ¡ = 2n T = ñk. (4.6-1)

La condición cuántica de Bohr se sigue directamente de esta hipótesis, si se


supone que las órbitas permitidas de la sección anterior alojan un número entero de
longitudes de onda de la partícula, definidas por (4.6-1 ). Puesto que la longitud de
trayectoria de la órbita es 21Trn, de acuerdo con este concepto, se debe determinar

o bien,
(4.6-2)

Davisson y Germer demostraron experimentalmente que los electrones podían,


en efecto, difractarse de los cristales, obteniéndose el mismo patrón para un cristal
dado que el que producen los rayos X de longitud de onda A = h/p, según propuso
De Broglie. La condición para la difracción de electrones de planos cristalinos es,
precisamente, la condición de Bragg siendo A igual a h/p,

nA. = nh/ p = 2d sen 9. (4.6-3)

Posteriormente se ha demostrado que los átomos neutros, los protones, los


iones positivos y otras partículas, presentan el mismo comportamiento ondulatorio, y
en cada uno de estos casos se satisface la relación de De Broglie ( 4.6-1 ).

4. 7 MECANICA ONDULATORIA

En 1926, Schrbdinger desarrolló un patrón unificado para la mecamca, basán-


dose en las ideas físicas de la teoría cuántica de Planck, y utilizando los conceptos
de De Broglie sobre la naturaleza ondulatoria de la materia. Este patrón, que se
denomina mecánica ondulatoria, constituye una versión muy general de las leyes de
la mecánica, diseñada especialmente para abarcar el campo de los fenómenos ató-
88 Mecánica cuóntictl. Generalidades

micos y nucleares. Este planteamiento ha tenido un éxito rotundo y, hasta donde se


puede afirmar en la actualidad, constituye una forma correcta de describir el com-
portamiento físico de la materia en una escala atómica o en cualquier escala, ya que
la mecánica ondulatoria proporciona los mismos resultados qu¡; la mecánica new-
toniana clásica para los sistemas relativamente grandes y masivos que se pueden
observar en forma macroscópica. Casi al mismo tiempo, Heisenberg diseñó otro sis-
tema de mecánica cuántica denominada mecánica de matrices, basada en las mismas
ideas físicas que la mecánica ondulatoria. Aunque su formulación matemática difiere
bastante de la mecánica ondulatoria de Schrodinger más tarde se demostró que, en
realidad, las dos mecánicas constituyen sistemas equivalentes. La exposición de esta
obra se confirmará mayormente a la descripción de la mecánica ondulatoria de
Schrodinger, que es más sencilla y se relaciona con mayor facilidad a las situaciones
físicamente observables.
En la formulación de Schrodinger de la mecánica cuántica, una cantidad com-
pleja '11, denominada función de onda, se relaciona con un sistema dinámico. Esta
cantidad es una función de tres coordenadas espaciales para cada partícula del sis-
tema, y el tiempo. Las propiedades dinámicas del sistema están íntimamente rela-
cionadas con las propiedades de la función '11 y el comportamiento dinámico del
sistema se puede determinar cuando se conoce la función '11 del sistema. Para un sis-
tema de una sola partícula, que será el tema general de este libro, las propiedades
de la función de onda '11 se pueden expresar de acuerdo con los siguientes cinco
postulados: 1

l. Se tiene una función de onda compleja relacionada con la partícula,


'11 (x, y, z, t), en donde x, y, z, son las coordenadas espaciales y t es el
tiempo.
2. La expresión clásica correspondiente a la energía total e del sistema (que se
conoce con el nombre de Hamiltoniano clásico del sistema) dado por
p2
2m + V(x,y,z) =e, (4.7-1)

en donde p es la cantidad de movimiento de la partícula, m es su masa y


V(x, y, z) es la energía potencial, se pueden convertir en una ecuación on-
dulatoria por medio de ciertos operadores de asociación con las cantidades
dinámicas clásicas, y permitiendo que estos operadores se apliquen a la
función de onda como lo indica (4.7-1). Los operadores correspondientes a
las cantidades dinámicas pertinentes son:

dynamical variable associated operator


X, y, O Z ~ X, y, O Z
f(x,y,z) ~ f(x,y,z)

p ~
~V (4.7-2)
'
ha
e ~
; ot ·
1 C. W. ShNwin, lntrodur·tion to Quantum Mechanics, Holt, Rinehart and Winston, Nueva
'orl.. (1959). p;Í¡:ina 14. pJ¡•ina\ li2-63 Con'>Ílltcs<' también respecto a la ampliación de estos
P<"tul.ld<" a ~~~ll'llla~ de m..Í\ de una partícula
Mecánica ondulatoria 89

Puesto que las componentes cartesianas de operador son (3/3x, 3/3y, 3/3z),
es evidente que los operadores correspondientes a las componentes de la can-
tidad de movimiento Px• Py· Pz son (h/iX3/3x), {h/iX3/3y) y (h/iX3/3z), res-
pectivamente. Así también, puesto que p2 = p • p, el operador correspondien-
te p 2 debe ser - tJ2( V· V) o - fi2 V2 , de donde, V2 representa al operador
laplaceano 32 ¡ax2 + 3 2 /3y 2 + 32 /3z 2 , Al reemplazar las cantidades dinámicas
p 2 , V(x, y, z) y e en ( 4.7-1) con sus operadores correspondientes y al permi-
tirles que operen sobre la función de onda '11, se obtiene la ecuación on-
dulatoria
h2 2 ñ a'l'
- V 'Y
- 2 + V(x,y,z)'l' = - 7 -. (4.7-3)
m 1 at
Esta es la ecuación de Schrodinger para la función ondulatoria, que con
frecuencia se expresa en la forma

ha'Y
Jt"'Y = - - - (4.7-4)
¡ ot '
en donde Jlf representa el operador hamiltoniano
h2
Jt" =- 2m V
2 + V(x,y,z). (4.7-5)

3. Las cantidades 'IF(x, y, z, t) y V'll deben ser finitas, continuas y de un solo


valor para todos los valores de x, y, z y t.
4. La cantidad '11*'11, en donde '11* es el conjugado complejo de '11, es siempre
una cantidad real. Esta cantidad se interpreta como la densidad de proba-
bilidad en el sentido de que '11*'11 dv es la probabilidad de que las partícu-
las se encuentren dentro del elemento de volumen dv en el instante t. Esta
es toda la información respecto a la ubicación real de la partícula, que se
puede obtener de la función de onda; en cuanto al sitio exacto en donde se
encuentra la partícula en un momento dado y cuál es su trayectoria, esto
no se puede determinar en forma precisa de acuerdo con la mecánica cuán-
tica. Por supuesto, para un objeto grande o masivo, '11*'11 es grande sólo
dentro de las fronteras clásicas del objeto y se mueve en el tiempo según lo
predicen las leyes de Newton; pero, en una escala atómica, será imposible
localizar una partícula en forma exacta y seguir su trayectoria con minucio-
sidad. Puesto que '11*'11 dv es una densidad de probabilidad y, puesto que la
probabilidad de que la partícula se encuentre en algún punto en el espacio,
es la unidad, es necesario que la función de onda sea normalizada de tal
manera que

i 'Y*'I'dv=1, (4.7-6)

tomándose la integral sobre todo el espacio.


S. El promedio o valor esperado (a.) de cualquier variable dinámica a con la
que se asocia un operador a 0 p.• se define mediante

(01) = i '1'*01op '1' dv, (4.7-7)

tomándose la integral sobre todo el espacio.


90 Mecánica cuántica. Generalidades

Las características esenciales de toda la mecánica ondulatoria están contenidas


en estos cinco postulados. Lo que resta de este análisis estará dedicado a examinar
las implicaciones de la misma y a aplicarlas a problemas específicos. No se puede
demostrarlas, sólo se puede enunciar que los resultados obtenidos, siempre que se
han sometido a prueba por medio de experimentos, han coincidido con las observa·
ciones dentro de los límites de la incertidumbre experimental que, en muchos casos,
ha sido extremadamente pequeña. Por supuesto, se tratará de demostrar que los
resultados de la mecánica ondulatoria son paralelos con los dictados de la intuición
y coinciden con los resultados de la mecánica clásica cuando puede esperarse que
esto suceda.
En relación al último punto, se puede demostrar que la mecánica ondulatoria
proporciona los mismos resultados que la mecánica clásica en los que se relaciona
con los valores promedios o esperados de cantidades dinámicas. Para hacer las cosas
más sencillas, sea una situación unidimensional en la que el sistema dinámico está
confinado al eje x. El valor esperado de la cantidad de movimiento Px, de acuerdo
con (4.7-7), es, entonces,

<Px) = f oo

_ 00
li a
'l'*(x,t) · - -:--a 'l'(x,t) dx,
1 X
(4.7-8)

por lo que, al tomar una derivada de tiempo y diferenciarla bajo el signo de la


integral de la derecha,

d(px)
-- = -
li f"" a'I:'* -a'I:' dx
- + -li f"" - '1' dx
2
'1' *8 (4.7-9)
dt i -ro at ox i - 00 oxot .

Ahora, el valor de a\f! jat está dado por la ecuación de onda (4. 7-3) y el valor
de a\f!* jat se puede expresar en forma similar escribiendo la ecuación de onda en
función de \f!* en lugar de hacerlo en función de \f!. Esto se logra escribiendo la
función compleja \f!(x, t) como la suma de partes reales e imaginarias

'l'(x,t) = u(x,t) + iu(x,t), (4.7-10)

substituyendo esta forma de \f! en (4.7-3) e igualando las partes reales e imaginarias
de ambos lados de la expresión resultante, para obtener dos ecuaciones de la forma

(4.7-11)
li 2 2 au
--Vu+uV=ñ-.
2m ot

Si se multiplica la segunda de estas ecuaciones por - i y se suma a la primera,


se obtiene una ecuación de onda para \f!* ( =u - iv) de la forma

li 2
- - vzll'* + Vtl' * = ñ D'l'*
- --. (4.7-12)
2m ' it
Dependencia del tiempo de la función de onda 91

En la ecuación ( 4. 7-9), si se expresa a\lt j"ot por medio de ( 4. 7-3) y a\lt* jat
mediante (4.7-12), se obtiene

d(px) = - ~ foo [azq¡* o'l' -'V* o3'!1] dx + foo [ V'!l* o'V- '1'* ~ (V'I')] dx
dt 2m -oo ox 2 ax ox 3 -oo OX ax

= - ~ f<X) [~ (a'!l
o'V* - '1'* azq¡)] dx- Joo 'V* av '1' dx
2m -ac ox ox OX ox 2 -oo ' ox
= - ~ [o'V* o'V- 'V* az~]oo - Joo 'V* av 'V dx. (4.7-13)
2m ox ax OX o -oo -oo ax

De acuerdo con el postulado ( 4) anterior, la integral de la cantidad \lt*\lt =


u 2 + v 2 sobre el rango de oo a - oo, debe existir; esto significa que tanto u y v,
como sus derivadas, deben tender a cero conforme x se acerca a oo ó - oo. Por tanto,
\lt y a\lt jax tienden a cero dentro de estos límites, y el primer término de la
expresión (4.7-13) desaparece. No obstante, de acuerdo con el postulado (5) ante-
rior, el segundo término de ( 4. 7-13) representa el valor esperado de la cantidad
- aV/ ax, que es la fuerza clásica ejercida sobre la partícula. En consecuencia, se
tiene que

(4.7-14)

que es, sencillamente, la ley del movimiento de Newton. Por tanto, es evidente que
en lo que respecta a los valores esperados, la mecánica ondulatoria concuerda con
las ecuaciones de la mecánica clásica.

4.8 DEPENDENCIA DEL TIEMPO DE LA FUNCION DE ONDA

Se supondrá que la ecuación de Schrodinger (4.7-3) se puede resolver mediante


las técnicas matemáticas usuales o sea, separando las variables. Así pues, se supon-
drán soluciones de la forma

'V(x,y,z,t) = 1/J(x,y,z)r/J(t), (4.8-1)

en donde 1/1 depende sólo de las coordenadas espaciales y 41 depende sólo del tiempo.
Al derivar (4.8-1) y al substituirla nuevamente en (4.7-3), es evidente que

n
--rjJV
2
2
1/1+ Vr/Jl/1= ---:1/1-.
n dr/J
(4.8-2)
2m z dt

Si se dividen ambos lados de la ecuación entre \lt = 411/J, se tiene que

¡¡z vzlf¡ 1i 1 dr/J


- - - + V(x,y,z) = - - - - =e. (4.8-3)
2m 1/J i </> d t
92 Mecánica cuántica. Generalidades

En ( 4.8-3), el lado izquierdo es una función exclusiva de las coordenadas


espaciales, en tanto .:¡ue la expresión central está en función del tiempo solamente.
La única forma en que esta igualdad se puede aplicar a todos los valores de las
variables, es que cada expresión por separado sea igual a una constante denominada
constante de separación y representada por e en ( 4.8-3). En realidad, son dos ecua-
ciones separadas, una para cp(t), y la otra para ¡J;(x, y, z), de donde,

ie
d</Jfdt = - - </J(t) (4.8-4)
h
y

.1 2 lj¡ 2m (e-
+ ""j;2 V(x,y,z)) 1/1( x,y,z ) -O.
_ (4.8-5)

La ecuación ( 4.8-4) se puede integrar de tal modo que dé

(4.8-6)

La constante de integración que normalmente aparecería como un factor multiplica-


tivo ( 4.8-6) se iguala arbitrariamente a la unidad. Al hacer esto, no se pierde la
generalidad que se ha venido sosteniendo. De acuerdo con ( 4.8-1), la función de
onda dependiente del tiempo, '11, se puede expresar ahora como

I.JI(x,y,z,t) = ¡f¡(x,y,z)e-ietfn, (4.8-7)

en donde ¡J;(x, y, z) es una solución de ( 4.8-5).


La expresión ( 4.8-5) se denomina ecuación independiente del tiempo, de
Schrodinger, y sus soluciones ¡J;(x, y, z) se llaman funciones de onda independientes
del tiempo o de estado estacionario. La ecuación ( 4.8-5) se puede expresar también
como sigue

(4.8-8)

en donde ;jf es el operador hamiltoniano expresado por (4.7-5). Normalmente con-


viene, siempre que sea posible, resolver las ecuaciones independiente del tiempo
( 4.8-6) y utilizar lo más que se pueda sólo las funciones de onda independientes del
tiempo. Las dependencias del tiempo, siempre que se necesiten, se pueden expresar
utilizando ( 4.8-7).
Para lograr esto en forma correcta, se deben observar ciertos resultados que se
obtienen cuando la función de onda tiene la forma ( 4.8- 7). En primer lugar, si la
función de onda tiene esta forma, entonces,

(4.8-9)

y '11*\lf propiamente dicha es independiente del tiempo e igual a ¡J;*¡J; -; la termino-


logía de funciones de onda de estado estacionario, se aplica a funciones de onda de
esta índole. Como consecuencia de este resultado, ¡J¡*¡J¡ tiene la misma interpretación
de densidad de probabilidad con respecto a las funciones de onda independientes del
tiempo, que la que tiene \lf*\lf con respecto a las dependientes del tiempo. Además,
de acuerdo con ( 4.8-9), se sigue que

1 •p*•p dv = 1 ¡f¡*¡f¡ dv = 1, (4.8-10)


Dependencia del tiempo de la función de onda 93

y que la condición de normalización para las funciones independientes del tiempo


(4.8-7) es, por tanto, la misma que la que corresponde a las funciones dependientes
del tiempo. Por último, si las funciones de onda tienen la forma (4.8-7) y si a 0 p.
depende sólo de las coordenadas y no explícitamente del tiempo, el valor esperado
de ia variable dinámica representado por el operador CXop. se puede expresar como

(4.8-11)

ya que los factores exponenciales de tiempo se anulan al igual que sucede en


(4.8-9), si CXop. no tiene una dependencia explícita del tiempo. Si a 0 p. depende
explícitamente del tiemp<', entonces las funciones de onda dependientes del tiempo
se deben emplear normalmente para evaluar (a).
Se debe observar que estos resultados pueden aplicarse sólo cuando la función
de onda total tiene la forma (4.8-7). Si la función de onda total - ('ñ/iXo/ot), es
una superposición de funciones de la forma ( 4.8-7) -como puede suceder aun cuan-
do se satisfaga la ecuación ondulatoria dependiente del tiempo- estos tres resultados
ya no son válidos y, para calcular las propiedades del sistema, se deben utilizar las
funciones de onda dependientes del tiempo.
Se puede demostrar fácilmente, usando la función de onda (4.8-7) en (4.7-7),
con el operador de energía dependiente del tiempo - (h/i)(o/ot), que el valor espe-
rado de la energía de un sistema en un estado representado por una función de
onda de esta clase es, sencillamente, el valor de la constante de separación e. Por
supuesto, se puede prever este resultado gracias a la notación seleccionada para la
constante de separación. También se puede demostrar, a partir de (4.8-8), que el valor
esperado del operador hamiltoniano :tf para un sistema en un estado representado
por este tipo de función ondulatoria (el cual, puesto que :tf es un operador inde-
pendiente del tiempo, se puede calcular empleando la función de onda independiente
del tiempo de acuerdo con (4.8-11)), es igual a e, el valor esperado de la energía.
Las expresiones (4.8-4) y ( 4.8-5) no imponen ninguna restricción en el valor de
e, ya que para cualquier valor de e existe una \}1 que satisface estas ecuaciones. Sin
embargo, los requisitos de continuidad, el aspecto finito y el valor único, pueden
seleccionar, de entre el continuo infinito de soluciones posibles, sólo ciertas solu-
ciones individuales que satisfagan estas condiciones, que corresponden a ciertos va-
lores discretos de la constante de separación (y, por tanto, la energía) e. De esta
manera se puede encontrar que sólo un grupo determinado de soluciones 1/ln(x, y, z)
que se relaciona con un conjunto asociado de niveles energéticos En es aceptable
como funciones de onda para el sistema, debido a que sólo estas funciones satisfacen
la ecuación de onda y, a la vez, las condiciones de frontera. Las funciones de onda
aceptables se denominan funciones propias del sistema (tomado del alemán eigen,
que significa propias o características), y los niveles de energía correspondientes se
llaman valores propios de energía. Los niveles discretos de energía del oscilador de
Planck y el átomo de Bohr son, en realidad, valores propios de esta naturaleza. De
acuerdo con ( 4.8-6), se puede ver claramente que la frecuencia de la función de
onda obedece siempre a la relación de Planck

e = liw. (4.8-12)

En algunos casos, tanto la ecuación de onda como las condiciones de frontera


asociadas con ella se pueden satisfacer para cualquier valor de e, o, cuando menos,
para cualquier valor de e dentro de un intervalo finito dado. En tales casos existe
un rango continuo de energías permisibles o un continuo de niveles energéticos. Más
94 Mecánica cUJÍntica. Generalidades

adelante se verá en qué circunstancias particulares se presentan estas situaciones


posibles.

4.9 LA PARTICULA LIBRE Y EL PRINCIPIO


DE INCERTIDUMBRE

A continuación se examinará la función de onda de una partícula libre, es


decir, que no está sujeta a fuerzas y que, por tanto, se mueve en una región de
potencial constante. Este estudio se limitará a una geometría unidimensional en la
que el movimiento está restringido al eje x. Por conveniencia y, para no perder
generalidad, el potencial se puede considerar con un valor de cero, en cuyo caso la
ecuación ( 4.8-5) se convierte en

(4.9-1)

en donde

k= J2mejh2. (4.9-2)

La ecuación (4.9-1) es de un tipo diferencial ya conocido que tiene soluciones de la


forma

t/J(x) = Ae±ikx, (4.9-3)

en donde A es una constante arbitraria. Estas soluciones satisfacen todos los requi-
sitos de las funciones de onda excepto, en un sentido estricto, la integrabilidad en el
intervalo - oo < x < oo. Sin embargo, será necesario aceptarlas aunque, como se verá
más adelante, se pueden originar ciertas dificultades para satisfacer los requisitos de
normalización. Las funciones de onda dependientes del tiempo del sistema, de acuer-
do con (4.8-7), serán

'l'(x,t) = Aei(lkx-wt), (4.9-4)

en donde, de acuerdo con (4.9-2),

flk2
w = efñ = - . (4.9-5)
2m

Las soluciones dependientes del tiempo ( 4.9-4) representan ondas progresivas; si


se escoge el signo +, la dirección de propagación es a lo largo del eje + x; si se
selecciona el signo --, la dirección de propagación es en sentido opuesto. Por tanto,
se puede hacer la misma selección de signo para las funciones independientes del
tiempo (4.9-3) para representar ondas que se propagan (en el tiempo) en estas
direcciones respectivas. El valor esperado de la cantidad de movimiento de la par-
tícula, de acuerdo con ( 4.8-11 ), está dado por

(4.9-6)
La partícula libre y el principio de incertidumbre 95

No obstante, de acuerdo con (4.9-3), se puede ver que a¡J¡¡ax = ± ikl/l, por lo
que (4.9-6) se convierte en

oo h
(p}) = ±ñk f
-oo
1/1*1/1 dx = ±ñk = ± -:;.
A
(4.9-7)

Esta expres10n es, sencillamente, un enunciado de la relación de De Broglie (4.6-1);


por tanto, la relación de De Broglie para partículas libres está contenida implícita-
mente en los postulados de la mecánica ondulatoria. Además, por lo que establece
(4.9-5), es evidente que

iz2k2 (p2)
B=--=-- (4.9-8)
2m 2m'

lo cual concuerda con el resultado clásico.


Al intentar normalizar la función de onda ( 4.9-3) de acuerdo con los requisitos
de (4.8-10), se encuentra que el valor de A*A debe escogerse en tal forma que sea
infinitesimalmente pequeño a fin de que no diverja la integral (4.8-10). Puesto que,
de acuerdo con (4.9-3), la probabilidad 1/1*1/1 dx de encontrar la partícula dentro de
un intervalo dx alrededor de un punto x es la misma en todos los puntos e igual a
A*A dx y, puesto que la probabilidad clásica a priori de encontrar una partícula
libre dentro de una región finita específica de una línea infinita, es infinitesimal-
mente pequeña, no es sorprendente que esta situación se haya presentado. En efecto,
esto coincide con lo que se podía haber esperado desde el punto de vista físico. No
se intentará resolver esta dificultad de un modo muy riguroso, sólo se observará que
no existen problemas graves al aplicar la condición de normalización (4.8-1 0), siem-
pre que se reconozca la naturaleza singular de las circunstancias que determinan la
magnitud de A*A y no se intente evaluar esta cantidad explícitamente en términos
numéricos.
Las soluciones de la ecuación de Schrodinger independiente del tiempo ( 4.8-5)
dan funciones de onda de la forma (4.9-3) o (4.9-4), que representan ondas planas
que se propagan a lo largo de la dirección ± x. Puesto que la densidad de probabi-
lidad '11!*'11! asociada con estas funciones es independiente del tiempo, las soluciones
(4.9-3) son funciones de onda de estado estacionario. Cada función de onda de
estado estacionario se relaciona con un valor único de energía E y, por ende, de
acuerdo con (4.9-8) y (4.9-7), representa un estado cuya constante de propagación
tiene un valor único k y cuya cantidad de movimiento tiene un valor único Px ( = lik).
No obstante, puesto que la amplitud de las ondas es constante, éstas se desplazan
de un modo uniforme desde oo a - oo, y, en consecuencia, no tienen una ubicación
única en el espacio. Dado que las condiciones de frontera de continuidad, de lo
finito, de unicidad, etc., se satisfacen igualmente para cualquier valor de E o k, existe
un rango continuo de valores permitidos para estos parámetros.
Mediante la superposición de soluciones de este tipo, cada una de las cuales
corresponde a un valor diferente de E y k, se pueden construir funciones de onda de
la forma

(4.9-9)
Debido a la linealidad de la ecuación dependiente del tiempo de Schrodinger,
este tipo de funciones de onda superpuestas son soluciones perfectamente adecuadas
para la ecuación dependiente del tiempo (4. 7-3); en cambio, no satisfacen la ecua-
96 Mecánica cuántica. Generalidades

ción independiente del tiempo ( 4.8-3) debido a que no tienen la forma ( 4.8-7). La
amplitud de probabilidad asociada con esta clase de soluciones, no es independiente
del tiempo, como sucede con las soluciones de estado estacionario. El método de
superposición se puede aplicar en forma más amplia de manera que un número
infinito de soluciones de estado estacionario se combine en una función de onda de
la forma

'l'(x,t) = L Anei(kn.x-mntl. (4.9-10)


n

Los valores de kn se pueden escoger muy cerca unos de otros, separados sólo por
intervalos dk, y los valores An pueden asumir la magnitud de cualquier función dada
de k en estos puntos, en cuyo caso, la superposición ( 4.9-1 O) se puede convertir, en
el límite, en una integral de la forma

'l'(x,t) = f~ 00
A(k)ei<kx-mt) dk. (4.9-11)

Como ejercicio, el lector puede verificar fácilmente el hecho de que ésta constituye
todavía una solución a la ecuación dependiente del tiempo de SchrOdinger (4.7-3).
La función A(k) de (4.9-11), puede ser cualquier función de k en tanto exista la
integral.
Supóngase ahora que, en algún instante de tiempo, por ejemplo, t = O, se trata
de formar una función de onda cuya densidad de probabilidad '11*'11 se localiza en
una región particular del eje x, por ejemplo, entre los puntos x = a/2 y x =- a/2,
como se ilustra en la figura 4.6. Esto se puede lograr construyendo una superpo-
sición de soluciones de la forma de estado estacionario (4.9-4), perteneciendo a
diferentes valores de k, de acuerdo con (4.9-11). Por ejemplo, se puede escoger

A( k) = e sen !(k - k 0 )a
(4.9-12)
t(k- k 0 )a '

en donde e y k 0 son constantes. Se verá directamente que esta selección de A(k) es


la correcta si '11*'11 es como se representa en la figura 4.6. Si se substituye (4.9-12)
en (4.9-11) y t se hace igual a cero, es evidente que

'll(x,O) = e f"' sen t(k - ko)a eikx dk. (4.9-13)


-=o t(k- k 0 )a

'11*'11 (/=O)

Figura 4.6. La función de densidad de probabilidad de una partícula que, de alguna manera,
debe encontrarse forzosamente a lo largo de la región del eje x que se extiende
entre a/2 y +a/2.
La partícula libre y el principio de incertidumbre 91

Si se hace que

q =k- k 0 , (4.9-14)

esto se puede escribir en la forma

'l'(x,O) =Ce'
.k
o.c
foo sen !qa .
- - - e'q" dq. (4.9-15)
-oo !qa
Ahora, de acuerdo con el teorema de la integral de Fourier2, una función arbitraria
f(x) se puede expresar como una integral de Fourier mediante

1 JO() . JO() . ,
f(x) =- e'q" dq f(x')e-•qx dx'. (4.9-16)
2n _ oo - oo

Si la función representada como 'lt*'lt en la figura 4.6, es decir,

(x) = 1/a (- a/2 < x < a/2)


(4.9-17)
=O (x > a/2; x < -aí2)

se expresa en forma de integral utilizando (4.9-16), se puede demostrar de un modo


directo que

1
f(x) = -
Joo
sen fqa .
- - - e'q" dq = 1/a (- a/2 < x < a/2)
2n _ oo tqa (4.9-18)

=O (x > a/2; x < -a/2).

Utilizando este resultado para expresar la integral en (4.9-15) con mayor sencillez, se
encuentra que 3

2nC .k
'l'(x,O) = -- e' 0" ( -a/2 < x < a/2)
a
(4.9-19)
=0 (x > a/2; x < -a/2).

La constante de normalización C se debe escoger en tal forma que satisfaga (4.7-6),


según lo cual
4n2;2 f!a dx = 4n2C2 = 1
a -!a a

2 Véase, por ejemplo, R. V. Churchill, Fourier Series and Boundary Value Problems,
McGraw-Hill Book Co. Inc., Nueva York (1941), capítulo V.
3 Aunque todas las funciones de superposición A(k)ei(kx-wt) satisfacen el requisito de
continuidad de las funciones de onda, la suma real, según lo expresa (4.9-19), no satisface este
requisito para x =±a. Esta violación de los requisitos formales no introduce, por tanto, ningún
error en los cálculos ya que, evidentemente, la función del pulso cuadrada (4 9-19) se puede
"redondear" muy cerca de x =±a para satisfacer la condición de continuidad sin introducir
ninguna alteración significativa en la forma de la función A(k).
98 Mecánica cuántica. Generalidades

o bien,

e= .J~/(2rr). (4.9-20)

Entonces,

1 'k
'P(x,O) = J~ e' ""' (- a/2 < x < a/2)
(4.9-21)

=0 (x > af2;x <- a/2)

En otras palabras, si A(k) se escoge como en ( 4.9-12), con e= ,jíi/(2rr), la


función de onda en el instante t = O, dada por ( 4.9-15), se puede expresar en la
forma sencilla (4.9-21). La amplitud de probabilidad 'lt*(x, O)'lt(x, O) existente en
t = O es, entonces, la de la figura 4.6 y la "partícula" se localiza dentro de una dis-
tancia & = a alrededor del origen. Sin embargo, para lograr esta localización, es
necesario introducir una superposición de funciones de ondas estacionarias corres-
pondientes a varios valores de k y, por ende, a varios valores de can ti dad de movi-
miento lík. Las amplitudes relativas de las diversas componentes en la sup~osición,
están dadas por la función A(k) y, por tanto. por (4.9-12) siendo e=ya/(2rr). En
la fi~ura 4. 7 aparece una gráfica de estas amplitudes de contribución en función de
ka. Las principales contribuciones provienen de la región cercana a k = k 0 y la
contribución desciende rápidamente para componentes con valores de k mucho ma-
yores o mucho menores que k 0 • Se puede considerar que las contribuciones a la
superposición de valores de k mayores que k 0 ++~ y menores que k 0 -+~ son
despreciables, siendo ~ un parámetro que expresa la anchura efectiva de la parte de
la curva de A(k), en donde A(k) asume valores que no son pequeños en compa-
ración al valor máximo A(k 0 ). Si arbitrariamente se escoge un valor tal de ~ que
t:J...ka) = 8rr, o sea, una posición correspondiente al segundo cero de la curva a ambos
lados de k= k 0 , -siendo ésta una selección ;azonable de acuerdo con el criterio
anterior- se tiene que

Ak = 8rrfa. (4.9-22)

A(k)

Figura 4. 7. lli~trihudón de la amplitud de la cantidad de movimiento correspondiente a la


·'lnplltud de (Hl'h.lhilida<l fl<' la figura 4 6.
La partícula libre y el principio de incertidumbre 99

El producto de la distancia Ax dentro de la cual se puede considerar que se localiza


la partícula, y la incertidumbre !lk en la cantidad de movimiento que se introduce
mediante la superposición de estados requerida para lograr esta localización, es

8n
ó.k · ó.x =-·a= 8n,
a

o bien, puesto que k = p/h,


ó.p · ó.x = 8nli. (4.9-23)

Olvidando los valores numencos que se obtienen de la selección arbitraria de un


punto de corte para !::k, y utilizando el símbolo - para indicar "del orden de'', se
puede escribir
ó.p . ó.x - li. (4.9-24)

Para una partícula libre cuya cantidad de movimiento se caracteriza por un


valor único singular de k, la "partícula" se extiende a lo largo de todo el espacio. Si
la partícula debe estar dentro de una región dada del espacio, entonces, su función
de onda, que ahora se debe considerar como una superposición de funciones de
estado estacionario con diferentes valores de k, se caracteriza por un "despliegue" de
valores de cantidad de movimiento tal que se obedezca a (4.9-24), según se ilustra
en la figura 4.6. Fste es un ejemplo específico de un efecto conocido con el nom-
bre de Principio de incertidumbre de Heisenberg, el cual es una consecuencia muy
general deducida de la descripción de la naturaleza en términos de la mecánica
ondulatoria. El principio de incertidumbre establece que la posición de una partícula
y su cantidad de movimiento no se pueden definir simultáneamente con precisión
arbitraria; cualquier experimento que se realice para asegurar que la partícula se
localizará dentro de una región dada del espacio, introducirá inevitablemente una
mcertidumbre en su cantidad de movimiento, que estará dada por (4.9-24). Se debe
recalcar el hecho de que este efecto es independiente de la precisión experimental
con que se pueden medir las cantidades de que se trata y, en realidad, es una
propiedad que tiene la materia en observación.
Por lo general, se puede demostrar que las relaciones de incertidumbre tales
como ( 4.9-24) existen entre todos los pares de variables dinámicas conjugadas que se
podrían usar clásicamente para especificar por completo el estado de movimiento del
sistema. Powell y Craseman 4 han escrito un análisis completo y detallado de este
tema. Si en (4.9-24) se escribe Ax = v t:.t, en donde v es la velocidad, se obtiene

V Ó.p Ó.t "' Ji. (4.9-25)

Puesto que, para una partícula libre, E= p 2 /2m, ÁE = p fjp/m = v fjp, (4.9-25) se pue-
de expresar como sigue
ó.e · ó.t - li. (4.9-26)

Por tanto, la relación de Heisenberg (4.9-24) también se puede expresar como la


incertidumbre de energía del tren de ondas multiplicada por la duración de éste.
Conviene observar que el comportamiento del "paquete de ondas" que se es-
tudió con anterioridad, se puede expresar como una función del tiempo por medio

4 J, L. Powell y B, Craseman, Quantum Mechanics, Addison-Weslcy, Reading. Mas~, (1961)


pág~nas 69-76; páginas 182-184,
100 Mecánica cuántica. Generalidades

de (4.9-11), con A(k) según la da (4.9-12). Se puede demostrar que el máximo de la


amplitud de probabilidad "11'*"11' se mueve a la velocidad constante hk0 fm, correspon-
diendo a una cantidad de movimiento constante hk0 según lo predice la m'ecánica
clásica. Además de este movimiento clásico del paquete como un todo, también se
sabe que el paquete se despliega conforme transcurre el tiempo, en tal forma que
siempre se satisface la relación de incertidumbre ( 4.9-24). En los casos de paquetes
de ondas que representan objetos grandes o masivos localizados dentro de distancias
macroscóp;r ente observables, este efecto de despliegue es tan pequeño que es
indetectabh: a una escala de tiempo razonable. s

4.1 O UNA PARTICULA EN UN POZO DE POTENCIAL


UNIDIMENSIONAL E INFINITAMENTE PROFUNDO

En este ejemplo se examinará el comportamiento de una partícula ubicada en


el pozo de potencial unidimensional que se ilustra en la figura 4.8. Para este sis-
tema, se tiene que

V(x) =O (O< x <a)


(4.10-1)
=00 (x <O; x >a).

En la región (O <x <a), en donde V0 , la ecuación de Schrodinger independiente del


tiempo (4.8-5) se puede reescribir como sigue

(4.10-2)

en donde

k= J2me/1i 2 • (4.10-3)

V(x) .. .
'
V=O-L....--~-x
X=O X=o
1 1

Figura 4.8. Un "pozo" de potencial infinitamente profundo.

s L Ikcnherry, Quantum Mechanics for Mathematicians and Physicists, Oxford University


Prt:'~~. Nut>va York (1962}, r:ígina 64.
Una partícula en un pozo de potencial unidimensional 101

En esta región, la partícula es libre y la solución ( 4.1 0-2) se puede expresar en la


forma (4.9-3). Sin embargo, es más conveniente escribirla en la forma equivalente

t/J(x) =A sen kx + B cos kx (0 < x <a), (4.10-4)

en donde A y B son constantes arbitrarias. Puesto que la partícula está limitada por
barreras de potencial infinitamente altas en x = O y x =a, se supondrá que

t/J(x) =O (x <O; x >a). (4.10-5)


Esta suposición, que parece ser físicamente razonable, se justificará más tarde en la
siguiente sección.
Si se requiere que t/l(x) sea continua en las fronteras del pozo de potencial
en x =O y x =a, entonces, (4.10-4) se debe reducir a cero en esos puntos. Si se
substituyen los valores x = O y x =a en (4.1 0-4) y el resultado se hace igual a cero,
es evidente que B =O y que

A sen ka= O. (4.10-6)

Esta condición se puede satisfacer sólo cuando

ka= nn (n = 1,2,3, ... ), (4.10-7)


de donde, sólo para una secuencia discreta de valores de k, que se identifican como
kn, en donde

k. = nnfo (n = 1,2,3, ... ). (4.10-8)

Puesto que k está relacionada con la energía por medio de (4.10-3), esta
condición se define como un conjunto discreto de valores propios de energía permi-
sibles
li2k! n2n21i2
e=--=--- (n = 1,2,3, ... ). (4.10-9)
• 2m 2ma 2
En la figura 4.9 se muestra un diagrama de los niveles de energía de este
sistema. En vista de los requisitos establecidos en ( 4.1 0-8), las funciones de onda del
sistema deben tener la forma
nnx
t/l.(x) = A. sen- (O< x <a),
a

=0 (x<O;x>a), (4.10-10)

en donde las constantes An están determinadas por los requisitos de normalización


( 4.8-1 0), de acuerdo con los cuales,

J oo
-oo
t/l:t/1. dx = A!
f" sen
o
2 -nnx
a
dx = 1 (4.10-11)

lo cual da
A.= 1/j~. (4.10-12)
102 Mecánica cuántica. Generalidades

·¡
25<¡ +------- E5

16<¡ +------- .•

4<¡ +------- •2 7T2h2

o -:l=======~·~~'_2_m_u_
2

Figura 4.9. Niveles de energía permisibles para una partícula que se encuentre dentro del pozo
de potencial ilustrado en la figura 4.8.

La dependencia del tiempo de las funciones de onda se determina fácilmente a partir


de ( 4.8-7). Por supuesto, las funciones ( 4.10-1 O) son funciones propias de estado
estacionario para las que '1'*'1' es independiente del tiempo.
Para este sistema, se sabe que existe un sistema de niveles discretos de energía,
dados por ( 4.1 0-9). La ecuación de Schrbdinger ( 4.1 0-2) dentro de la región permi-
tida de movimiento es la misma que para una partícula libre (4.9-1) para la que se
permite un rango continuo de valores de energía, y las soluciones ( 4.1 0-1 O) son
simplemente combinaciones lineales de las soluciones para la partícula libre de la
forma ( 4.9-3) pertenecientes a la misma energía. La diferencia entre los dos casos se
basa únicamente en las condiciones de frontera las cuales, en el pozo de potencial,
se pueden satisfacer sólo para un conjunto discreto de energías.
La condición de continuidad de la pendiente de las funciones de onda
(4.10-10) se viola abiertamente en x =O y x =a. Esta situación se origina debido a
la singularidad de la función de potencial V(x) en estos puntos y no produce
dificultades en la interpretación física de los resultados. Ei comportamiento de la
función de onda en estos puntos se puede inferir como un caso límite de los
resultados, que se verá en la siguiente sección, en donde se confirman los cálculos
que condujeron a ( 4.10-1 0).
Las funciones de onda ( 4.10-1 0), se pueden representar como sigue

(4.10-13)

en la región (O< x <a), vienen a ser superposiciOnes de ondas estacionarias de


soluciones de ondas planas para las que k= mr/a y - mrja, es decir, superposiciones
de una onda que se propaga en la dirección + x y otra de igual amplitud que va en
dirección opuesta. Puesto que las dos componentes de la superposición poseen la
misma energía, la combinación lineal ( 4.1 0-13) es una solución de la ecuación de
Schródinger independiente del tiempo ( 4.1 0-2) y, por tanto, representa todavía un
estado estacionario del sistema. El cuadro físico correspondiente es el de una par-
tícula que se refleja elásticamente en las paredes de un pozo de potencial, en x = O
y x =a, y oscila rápidamente hacia un lado y otro dentro del pozo de potencial. La
función de onda y la amplitud de probabilidad para la partícula en el estado energé-
tico más bajo y en un estado de energía más alto, se ilustran en la figura 4.10. De
acuerdo con la amplitud de probabilidad, cuántica la probabilidad de encontrar la
partícula en ciertos puntos correspondientes a ceros de 1/1*1/1 (que, en este' ejemplo,
Partícula en un pozo unidimensional de profundidad finita 103

.¡,•.¡,

.¡, (x) ljl(x) n (\

"-
(\

o o o _K

n~1
-x
V V
n~a
V V
(a)
(b)
Figura 4.10. Funciones de onda y amplitudes de probabilidad de dos determinados estados de
energía permisibles de una partícula que se encuentra dentro de un pozo infinita-
mente profundo.

es igual a l/; 2 , ya que ¡!; ('S real), se hace infinitamente pequeña. La amplitud de
probabilidad cuántica para lo~ estados de energía más bajos no concuerda con la
amplitud de probabilidad constante que se podría esperar desde el punto de vista
clásico y que en la figura se ilustra por medio de las líneas punteadas. Sin embargo,
para estados de energía más altos, además de la rápida oscilación de la amplitud
cuántica alrededor del valor clásico como un promedio, la coincidencia es aceptable
en el sentido de que el valor medio de la amplitud de probabilidad cuántica tomada
sobre cualquier intervalo de longitud apreciable es casi igual a la amplitud clásica.

4.11 UNA PARTICULA EN UN POZO UNIDIMENSIONAL


DE PROFUNDIDAD FINITA

El comportamiento de una partícula dentro de un pozo unidimensional de


profundidad finita se puede calcular, siguiendo las líneas generales del planteamiento
utilizado en la sección 4.1 O. En este caso se supondrá un pozo de potencial de la
forma ilustrada en la figura 4.11, en donde la profuncidad del po:w es V0 . Se
deben resolver ecuaciones por separado para la función de onda en las regiones
(x<-a), (-a<x<a) y (x>a), y las funciones de onda en estas regiones se
denominará, respectivamente, l/1-(x), l/1 0 (x) y l/l+(x). En primer lugar, se tratará el
caso de una partícula que está limitada clásicamente a permanecer dentro del pozo,
es decir, una partícula para la que - V0 <e< O.*
En las regiones fuera del pozo (x < -a; x >a), la ecuación (4.8-5) se convierte en

(x<-a;x>a) (4.11-1)

* N. de T. La partícula posee en esta región los estados ligados.


104 Mecánica cuántica. Generalidades

V(x)

o
- -x

-a~ -a-

(x) '~'o(x)

-Vo

Figura 4.11. Un pozo de potencial de profundidad finita.

en donde

(4.11-2)

mientras que, en el pozo, en donde V(x) =- V0 , (4.8-5) se convierte en

d2r/Jo 2
-d
X
2 + k 0 r/1 0 (x) = O (-a<x<a) (4.11-3)

en donde

(4.11-4)

Como se ha definido, en la condición (- V0 < € <O), k y k 0 son cantidades


reales. Las soluciones generales de (4.11-1) y ( 4.11-3) se pueden expresar como sigue

(x > a) (4.11-5)

r/1 0 (x) = A 0 sen k 0 x + B 0 cos k 0 x (-a<x<a) (4.11-6)

rf¡_(x) = A_ekx + B_e-kx (x <-a). (4.11-7)

Las condiciones de frontera de la función de onda requieren que dicha función


y su derivada sean continuas en x =±a y que la función de onda tienda a cero
conforme x "* ± oo. Por tanto, es necesario que
r/ló(a) = rf¡~(a) (4.11-8)

r/1 0 ( - a) = rf¡ _ ( - a) r/ló( -a)= rf¡'_( -a) (4.11-9)

1/J_(- oo) =O, (4.11-10)

en donde las primas indican las derivadas con respecto a x. En la expre-


sión (4.11-10), es evidente que A+= B_ =O. Los cuatro coeficientes restantes se
Partícula en un pozo unidimensional de profundidad finita 1OS

pueden evaluar mediante la substitución de las soluciones (4.11-5,6,7) en las cuatro


condiciones de frontera (4.11-8) y ( 4.11-9), de donde se obtiene un grupo de cuatro
ecuaciones simultáneas de la forma

=0

- A 0 sen k 0 a + B 0 cos k 0 a
(4.11-11)

A 0 k 0 cos k 0 a + B 0 k 0 sen k 0 a -A_ ke -ka = O.

Para resolver completamente el problema, se deben determinar los valores de


las cuatro constantes arbitrarias A 0 , B 0 , A_ y B+. Las expresiones (4.11-11) forman
un conjunto de cuatro ecuaciones homogéneas con estos coeficientes desconocidos.
Un resultado elemental de la teoría de las ecuaciones algebraicas lineales es que un
conjunto de ecuaciones de esta naturaleza no pueden tener otra solución que no sea
A 0 = B 0 =A_ = B+ = O, a menos que desaparezca el determinante de los coefi-
cientes del sistema. 6 Esto significa que no existen soluciones de significado físico, a
menos que

sen k 0 a cos k 0 a -1 o
e
- 2ka -sen k 0 a cos k 0 a o -1
=0. (4.11-12)
k 0 cos k 0 a -k 0 sen k 0 a k o
k» cos k 0 a k 0 sen k 0 a o k

Para obtener esta expresión, la can ti dad e- ka se sacó por factorización de las
columnas tercera y cuarta del determinante de los coeficientes de (4.11-11). Puesto
que e-2ka no desaparece para ningún valor real de ka, el determinante debe hacerlo
·a fin de satisfacer ( 4.11-12). El determinante se puede expresar como menores para
dar la ecuación

que se puede escribir también como

(k sen k 0 a + k 0 cos k 0 a)(k 0 sen k 0 a -k cos k 0 a) =O.


o, dividiendo entre cos 2 k 0 a,

(k tan k 0 a + k 0 )(k0 tan k 0 a- k)= O. (4.11-13)

Esta ecuación se satisface si desaparece cualquiera de los factores. Si se hace


que

(4.11-14)

6 Véase, por ejemplo, N. B. Conkwright, lntroduction to thc Theory of Equations, Ginn


and Co., Boston (1941), páginas 144-145.
106 Mecánica cuántica. Generalidades

entonces, de acuerdo con (4.11-4) y (4.11-2),

(4.11-15)

Al substituir esto en ( 4.11-13) e igualando cualquiera de los factores a cero, se


tiene que (4.11-13) se satisface si

o bien, ( 4.11-16)

1
1
1
1
1
1
1
1
t-- Curvas punteadas
1 y =-k0 ctn k0 o
1
1
1
1
1

Figura 4.12. Diagrama que ilustra la solución de las ecuaciones trascendentales de los valores
propios de energía asociados con el pozo de potencial mostrado en la figura 4.11.

Una de estas dos ecuaciones quedará satisfecha sólo para un conj,mto dado de
valores de k 0 , que se puede representar mediante k 01 , k 02 , k 03 , • • • kon, •••. Exis-
te un conjunto de valores propios de energía Erz que se relacionan con estos valores
de k 0 , de acuerdo con (4.11-4), por medio de

(4.11-17)

Los valores propios kon se pueden obtener gráficamente encontrando las inter-
secciones de las curvas y = - k 0 ctn k 0 a y y = k 0 tan k 0 a con el círculo y =
yp. 2 - k~, como se ilustra en la figura 4.12. Para cada punto de intersección se
satisface cualquiera de las dos ecuaciones (4.11-16). Por tanto, existe un grupo finito
específico de valores kon y un número finito de niveles discretos de energía asocia-
dos a estos valores, a través de (4.11-17). El radio del círculo y = yp. 2 - k~ de la
figura 4.11 es, sencillamente, p. que está directamente relacionado con la profun-
Partícula en un pozo unidimensional de profundidad finita 107

di dad del pozo de potencial por medio de (4.11-14). Para un pozo poco profundo,
J1~O, y únicamente habrá un solo nivel de energía en el rango - V0 <e< O. Para
pozos más profundos, aumenta el número de estados energéticos y para pozos muy pro-
fundos, este número es muy grande. Como se ilustra en la figura 4.12, en un pozo muy
profundo, los niveles que están en la parte más baja se caracterizan por valores de kon
que están espaciados equidistantemente, correspondiendo muy de cerca a los valores de
kn del pozo infinito de la sección 4.10. y dando origen a niveles de energía que, con res-
pecto a la base del pozo...,son semejantes a los del pozo infinito. En la figura 4.13 se
proporcionan los diagramas de niveles de energía para varios pozos fmitos.

--J --- ---


------
--- ---
---
---
--- -----
---
-----
---
Estados de energía para un pozo infinito-----
Estados de energía para un pozo finito -----
----
-
---
Figura 4.13. Representación esquemática de los niveles de energía correspondientes a pozos de
potencial de distintas profundidades.

Una vez se han determinado los valmes kon para los que ( 4.11-11) tiene
soluciones físicamente significativas, es necesario encontrar los coeficientes A 0 , B 0 ,
A_ y B+. Puesto que para los valores de kon que satisfacen (4.11-16) desaparece el
determinante del sistema homogéneo (4.11-11 ), las ecuaciones (4.11-11) ya no son
independientes linealmente y, por tanto, lo único que se puede obtener directamente
de (4.11-11) son las relaciones de los coeficientes. Sin embargo, las magnitudes reales
de los coeficientes se pueden encontrar imponiendo la condición de que

Una vez que se conocen los coeficientes, las funciones de onda se obtienen de
(4.11-5,6,7). El cálculo exacto de los coeficientes es un procedimiento laborioso y
no se presentará en detalle. No obstante, se analizarán algunas de las propiedades de
las funciones de onda que se obtienen de este modo.
Las funciones de onda para los estados energéticos ligados de este problema se
ilustran en la figura 4.14. Antes que nada, se observará que la función de onda
como un todo es una función par o bien, una función impar de x. En el ejemplo
de que se trata, el estado energético más bajo es par, el siguiente es impar, el que le
sigue es par, y así sucesivamente de un modo alternado. Esto se debe al hecho de
que el potencial V(x) es en sí mismo una función para de x; se puede demostrar de
108 Mecánica cuántica. Generalidades

un modo general que, cuando esto sucede, las funciones propias deben ser funciones
pares o impares de x. 7

Figura 4.14. Diagramas esquemáticos de las funciones de bnda de los estados energéticos más
bajos del pozo de potencial finito de la figura 4.11.

De acuerdo con la figura 4.14 y las ecuaciones (4.11-5) y (4.11-7), se puede


nr que a pesar de que la energía total de la partícula es negativa y, por tanto, de
acuerdo con la representación clásica dicha partícula nunca podría sobrepasar la
barrera de potencial para aparecer fuera del pozo, de hecho, la función de onda de
la partícula se extiende más allá de los límites del pozo. Por tanto, de acuerdo con
la mecánica cuántica, existe una probabilidad definida de que la partícula se encon-
trará en la región clásicamente prohibida, más allá de las fronteras reales del pozo.
La función de onda de la partícula se atenúa exponencialmente en esta región y se
acerca a cero en la parte que está lejos del pozo. Este fenómeno, que se conoce
como penetración de barrera, es un aspecto común del comportamiento cuántico de
la materia. Una partícula que se acerca a una barrera de potencial, de altura y
espesor finitos, como se ilustra en la figura 4.15, tiene una probabilidad determinada
de penetrar la barrera y aparecer en el otro lado, aun cuando esto pueda estar
prohibido de acuerdo con la teoría clásica. La función de onda se atenúa dentro de
la barrera, y si ésta es muy alta o gruesa, la atenuación se hace muy marcada y la
probabilidad de penetración se reduce mucho. En mecánica cuántica este efecto se
denomina túnel y se ha observado experimentalmente en dispositivos semiconduc-
tores y en capas aisladoras delgadas. Los efectos de reflexión semiconductores y en
capas aisladoras delgadas. Los efectos de reflexión se pueden predecir también de
acuerdo con la mecánica cuántica, para las partículas incidentes sobre una barrera,

7 Véase, por ejemplo, E. Merzbacher, Quantum Mechanics, John Wiley and Sons, Nueva
York (1961), página 53.
Partícula en un pozo unidimensional de profundidad finita 109

•t Vlxl

·- n -+X
(O)

(b)

Figura 4.15. Representaciones hechas de acuerdo con la mecánica clásica (a) y cuántica (b), de
una partícula que interactúa con una barrera de potencial cuya altura es mayor
que la energía inicial de la partícula. La representación cuántica (b) ilustra el
efecto túnel.

por ejemplo, como las que se muestran en la figura 4.15, aun cuando poseen más
de la energía necesaria para sobrepasar la barrera clásicamente. El efecto túnel pro-
porciona las explicaciones generalmente aceptadas sobre la ruptura eléctrica que se
produce en aisladores, la ruptura inversa en rectificadores semiconductores y la desin-
tegración radiactiva de Jos isótopos a-emisores.
Hasta ahora, este estudio se ha basado exclusivamente en la suposición de que
la energía total e es negativa, dentro del rango - V0 <e< O. En el caso en que e
sea positiva, es fácil apreciar en la expresión (4.11-1) que las soluciones 1/1± fuera
del pozo tienen una naturaleza oscilatoria, como sucede con la solución 1/1 0 en su
interior. En este caso, se encuentra que la ecuación de Schrodinger y todas las
condiciones de frontera se pueden satisfacer para cualquier valor positivo de e. Por
tanto, existe un rango continuo de estados energéticos permisibles y funciones pro-
pias correspondientes que se extiende en forma ascendente desde e= O en la figu-
ra 4.13. Esos estados se denominan "estados del continuo".
Para ver cómo sucede esto, supóngase que las funciones propias de este rango
de energía son funciones pares o impares de x; como se vio antes, esto es válido si
V(x) es una función par. De dor.de, para funciones propias pares, es necesario que

t/1 0 (x) = A 0 cos k 0 x (-a<x<a)

(x >a) (4.11-19)

(x < -a)

en donde k se define ahora como

k= J2me/ñ 2 (e> 0). (4.11-20)

Las condiciones de frontera (4.11-8) y (4.11-9) deben aplicarse todavía, de tal ma-
nera que los valores y las pendientes de 1/1 0 (x) y 1/J+(x) sean iguales en x =a. De
11 O Mecánica cuántica. Generalidades

acuerdo con ( 4.11-19), esto requiere que

A 0 cos k 0 a =A+ cos ka+ B+ sen ka

y (4.11-21)

-k 0 A 0 sen k 0 a = -kA+ sen ka+ kB+ cos ka.

Si se dividen ambas ecuaciones entre A 0 y se resuelve el grupo resultante de ecua-


ciones simultáneas para A+/A 0 y B+/A 0 , se tiene que

A+/A 0 = cos k 0 a cos ka+~ sen k 0 a sin ka


(4.11-22)

B+/A 0 = cos k 0 a sen ka- kko senk 0 a cos ka.


Por tanto, siempre se pueden encontrar valores perfectamente adecuados para A+ y
B+ en términos de A 0 , cuyo valor, a su vez, queda determinado por los requisitos
de normalización. Esto significa que cualquiera que sea el valor inicial que se escoja
para e o k, se puede encontrar una solución para l/1 0 , W+ y ¡J¡_ que satisfaga todas
las condiciones de frontera, como se aseguró antes. Se puede realizar un cálculo
similar principiando con las funciones propias impares y se obtendrá el mismo resul-
tado. En la figura 4.16 se ilustra el carácter general de las funciones de onda para
los estados del continuo.

(O) (b)

Figura 4.16. (a) Representación e~quemática de la función de onda de una partícula cuya
energía tan grande que, en la representación clásica, sobrepasa los límites del pozo
de potencial ilustrado. (b) División de los niveles de energía permisibles para el
pozo de potencial finito, en un grupo de niveles discretos correspondientes a
una partícula clásicamente ligada y a un continuo de niveles correspondientes a
una partícula clásicamente no ligada. La función de onda representada en (a)
pertenece al último grupo de niveles.
El oscilador armónico unidimensioanl 111

Este l.stado de cosas ejemplifica un principio mucho más general. Si la energía


total del sistema es tal que la partícula esté limitada clásicamente por medio del
potencial V(x) para moverse en una región finita dada del espacio, se tendrá un
grupo discreto de funciones propias y niveles de energía que satisfagan todos los
requisitos, de las funciones de onda. Por otro lado, para partículas con energías lo
suficientemente grandes para que una partícula clásica pueda escapar de cualquier
mínimo de potencial del sistema, al infinito en, cuando menos, una dirección, existe
también un continuo de estados energéticos y funciones propias correspondientes. 8
Los resultados de la sección 4.1 O para el pozo de potencial infinitamente pro-
fundo se pueden obtener a partir de los resultados de esta sección, si se deja que
V 0 tienda a infinito. En particular, se puede ver a partir de (4.11-5) y (4.11-7) con
A+= B_ =O, que si k se hace indefmidamente grande, como debe suceder para
cualquier estado con un energía finita superior a la base del pozo, conforme
V 0 ~ c..o, ia función de onda fuera de los límites del pozo tiende a cero. Conforme
el pozo se hace cada vez más profundo, la curvatura de la función de onda se hace
sumamente grande cerca de x = a y x = - a, en donde las soluciones 1/J +(x) y 1/J _ (x)
se unen a la solución 1/J 0 (x), se hace aunque para una profundidad finita de pozo, la
pendiente es siempre continua. Sólo en el límite, conforme la profundidad del pozo
se acerca a infinito, es cuando se presenta la discontinuidad en la derivada de la
función de onda en estos punto, como se mencionó en la sección 4.10.

4.12 EL OSCILADOR ARMONICO UNIDIMENSIONAL

El oscilador armónico es una partícula que está ligada a una postcwn de


equilibrio por medio de una fuerza proporcional al desplazamiento desde dicha posi-
ción; esta fuerza .:;e puede expresar como

F = -kx = -dV(x)fdx. (4.12-1)

Entonces, el potencial V(x) debe ser una parábola de la forma

(4.12-2)

De acuerdo con ( 4.12-1 ), la ecuación clásica de movimiento para una partícula


de masa m sometida a una fuerza de este tipo es

(4.12-3)

cuya solución es una función oscilatoria que se puede escribir como

x(t) =A sen (w 0 t- 15), (4.12-4)

en donde

(4.12-5)

8 Una simple prueba de estas afirmaciones se puede encontrar en la obra de L. Pauling y


E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill Book, Co., Inc., Nueva York
(1935).
112 Mecánica cuántica. Generalidades

es la frecuencia clásica del oscilador y en donde A y o son constantes. Siguiendo


este resultado clásico, se puede usar ( 4.12-5) para expresar la constante de fuerza k
en función de w 0 y m, y volver a escribir el potencial V(x) como

(4.12-6)

A continuación se procederá a resolver la ecuación de Schrodinger ( 4.8-5)


utilizando esta función de potencial; en este caso, (4.8-5) se convierte en

d21/1 2m 2 2
dx2 + hl [e- tmw 0 x ]1/J(x) =O. (4.12-7)

Para resolver esta ecuación, primeramente es necesario que

(4.12-8)

P= 2ef(ñw 0 ) (4.12-9)

e= x.j~. (4.12-10)

Entonces, de acuerdo con ( 4.12-8) y ( 4.12-9), es obvio que


d21/J
dx2 + (cx.p- cx.2x2)1/J(x) =O, (4.12-11)

y, por lo que indica (4.12-10) observando que d2 1/f/dx 2 =cx.d 2 1/1/d~ 2 ,


d21/J 2
de+ <P-e >1/Jce> =o. (4.12-12)

Para valores grandes de 1~1, tales que ~2 ~ (3, (3 se puede despreciar y (4.12-12)
se escribe como

(4.12-13)

Esta ecuación se satisface aproximadamente, para un valor grande de ~. por


medio de

(4.12-14)

puesto que d 2 1/1/de = (~ 2 - l)exp(- ~ 2 /2), lo cual satisface aproximadamente (4.12-13)


si ~ 2 ~ l. Esto sugiere que las soluciones 1/1(~) para (4.12-12) podrían expresarse
de manera más simple escribiendo

(4.12-15)

Y transformando (4.12-12) en una ecuación para la función H(~). Esto se logra


substituyendo la forma ( 4.12-1 S) en la ( 4.12-12) y como resultado, ( 4.12-12) se
convierte en

d2 H dH (4.12-16)
--2e-+<P-t)H<e>=O.
de de
El oscilador armónico unidimensional 113

Esta ecuación diferencial se puede resolver mediante una técnica de series de


potencias, suponiendo inicialmente que
00

H(') = L ak'k'
k~o
(4.12-17)

por lo que

(4.12-18)

• 00

(p- 1)H(') = L (p- 1)ak'k·


k=O

Si estas tres ecuaciones se suman se observa que el resultado es cero de


acuerdo con (4.12-16), y se encuentra que
oc
O= I. [(k+ 1)(k + 2)ak+l + [(p- 1)- 2k]ak],k. (4.12-19)
k=O

Esta ecuación debe ser aplicable para todos los valores de ~. y, por tanto, el
coeficiente de cada potencia ~ debe desaparecer por separado. (Esto se podrá ver
con mayor claridad evaluando los coeficientes para la expansión de la función .f(~) =
O en la serie de potencia de McLaurin; todas resultan ser cero.) Este requisito
establece inmediatamente una relación de recursión entre los coeficientes ak+ 2 y ak,
en donde

p - l - 2k
ak+2 = -(k+ l)(k + 2) ak. (4.12-20)

En la solución de cualquier ecuación diferencial de segundo orden, debe haber


dos constantes arbitrarias. Por tanto, sean a0 y a 1 las constantes arbitrarias funda-
mentales que deben determinarse de acuerdo con las condiciones de frontera, en la
expresión de la serie (4.12-17) para H(~), y expresar todos los demás coeficientes en
función de estos dos mediante la aplicación repetida de la relación de recursión
t.4.12-20). En esta forma, es fácil ver que

P-l
al= - - - a o
<P- 3)
a 3 =- - - - a 1
2! 3!

p- 5 <P - 1><P - 5) <P- 3)(p- 7)


a4 = - -¡-:-J a2 = 4! ao as= 5! a¡ (4.12-21)

(p- 1)(p- 5)(p - 9) <P - 3)(p - 1)(P - 11)


a6 = - 6! ao a1 = 7! al

etc., etc.
114 Mecánica cuántica. Generalidades

De acuerdo con (4.12-17), se de be tener

H(~) = ao[1- ((J- 1) e+ ((J- 1)((J- 5) ~4- ((J- 1)((J- 5)((J- 9) ~6 + ... ]
2! 4! 6!

+a¡[~_ {J- 3 e+ ({J- 3)({J- 7) ~S_ ({J- 3)({J- 7)({J- 11) e+ •••]
3! 5! 7! .
(4.12-22)

Si en la relación de recursión (4.12-20) {3- 1 - 2k debe ser cero para algún


valor del índice k, entonces, ak+l = O. Sin embargo, puesto que ak+4 es un múltiplo
de ak+l y ak+ 6 es un múltiplo de ak+ 4 , etc., todos los coeficientes subsecuentes
que se relacionan con ak por medio de la fórmula de recursión deben desaparecer, y
cualquiera de las dos series entre paréntesis rectangulares en (4.12-22) terminaría por
convertirse en un polinomio de grado k. Este fenómeno se puede producir sólo para
ciertos valores enteros de {3, en efecto, de acuerdo con (4.12-20), sólo ocurre cuando
{3 _ 1 es igual al doble de un entero, es decir, cuando

(J- 1- 2n =O
o bien,
p= 2n +1 (n = 0,1,2,3, ... ). (4.12-23)

Al examinar (4.12-22), se ve fácilmente que esta terminación de una u otra serie


para producir un polinomio se realiza efectivamente cuando {3 = 1, 3, 5, 7, . . . como
lo predice (4.12-23). De esto resulta que las únicas soluciones de (4.12-16), que llevan a
funciones de onda aceptables a través de (4.12-15), SO;'l estas soluciones polinómicas.
Para entender el porqué de esto, primero se considerará la expansión en serie
para la función et 2 , que se puede escribir

(4.12-24)

Para valores grandes de t las contribuciones de Jos términos iniciales de esta serie
son despreciables en comparación con aquellos para los que k es grande. Por su-
puesto, esto es cierto también en la serie de (4.12-22) para H(~). En la serie
( 4.12-24), la razón del coeficiente bk+l al coeficiente bk es

y para valores grandes de k,

b~:2 ~ 2/k. (4.12-25)


El oscilador armónico unidimensional 115

La razón de los coeficientes ak+ 2 y a k para las soluciones en serie de ( 4.12-16) está
dada por la relación de recursión ( 4.12-20) y, para valores grandes de k, se puede
ver claramente que también es más o menos igual a 2/k. Entonces las soluciones en
serie de H(~). cuando no terminan en polinomios, se comportan como e~ 2 para
valores grandes de ~- Sin embargo, de acuerdo con (4.12-15), las funciones de onda
reales están dadas por

(4.12-26)

para valores grandes de ~- Puesto que estas funciones no siguen siendo finitas en ±oo,
no son aceptables como funciones de onda para el sistema físico. Las únicas solu-
ciones que son aceptables son aquellas que terminan como polinomios, o sea, las
soluciones para las que se obedece (4.12-23). Si una de las dos series encerradas
entre paréntesis angulares de (4.12-22) termina como polinomio, la solución para
H(~) toma la forma

H(e) = a0 (polinomio) + a 1 (serie infinita)

H(~) = a 0 (serie infinita) + a 1 (polinomio).

En cualquier caso, para que la solución H(~) sea una función de onda físicamente
aceptable, la constante arbitraria que multiplica la solución en serie se debe escoger
en tal forma que sea cero, para que la expresión total de H(~) sea sencillamente un
polinomio. Si se expresa (3 en (4.12-13) en función de e por medio de (4.12-9), es
evidente que las únicas soluciones que dan las expresiones polinómicas para H(n son
las que corresponden a un grupo discreto de valores propios de energía

(n = 0,1,2,3, ... ). (4.12-27)

Una característica notable de este sistema es que su estado más bajo de ener-
gía, para el que n = O, está representado no por e0 = O, sino por e0 = -!-hwo. En
otras palabras, el estado más bajo de energía del oscilador armónico no se carac-
teriza por la ausencia de movimiento vibratorio, sino por una energía vibratoria
mínima de "punto cero" -thw 0 . En su teoría original de la radiación de cuerpo
negro, Planck supuso que los niveles energéticos de un oscilador armónico estaban
dados por En= nhw 0 más que por (4.12-27). No obstante, en ese caso en particular,
la energía de punto cero no establece ninguna diferencia en el resultado final. Se
observará que los pozos de potencial de las secciones anteriores presentaban también
este efecto de energía de punto cero. El diagrama de niveles de energía del oscilador
armónico se ilustra en la figura 4.17. El espaciamiento equidistante de los niveles es
una propiedad singular del pozo de potencial parabólico.
Las soluciones polinómicas que representan las funciones propias del sistema, se
pueden obtener de (4.12-22), considerando que (3 toma los valores 1, 3, 5, ••• 2n +
1, ••• de acuerdo con (4.12-23). Para cada uno de estos valores, cualquiera de las dos
series entre paréntesis rectangulares terminará en un polinomio y todos los coeficientes
más allá de cierto punto se convierten en cero. Por Jo común se escoge la constante arbi-
traria a0 o bien, a 1 , cualquiera que sea el caso, que multiplica el polinomio resultante en
tal fom1a que el coeficiente de la potencia más alta de ~ en el polinomio es 2n( =
116 Mecánica cuañtica. Generalidades

•t
15 fr
•8 2 "'o
13 ñ
7 2 "'o
11 ñ
6 2 "'o
5 ~ hw0
4 ~ fr..,o
3 ~ ,.,o
2 ~ ñ..,o
1
t fr..,o
o

Figura 4.17. Niveles de energía del oscilador armónico cuántico unidimensional.

2<13-l )/ 2 ). Cuando se hace esto, se obtiene un grupo de soluciones polinómicas fin(~) de


la forma

H¡<e> = 2e
H2<e> = 4e 2
H3<e> = se 3- 12
(4.12-28)

Hie> = 16e 4 - 4se


Hs(ü = 32es- 160e 3 + 12oe
etc.,

Los matemáticos conocen bien estas expresiones que se denominan polinomios de Her-
mite; la ecuación (4.12-16) recibe el nombre de Hermite. Los polinomios de Hermite
se pueden definir como

(4.12-29)

Se puede demostrar que la defmición (4.12-29) conduce a los polinomios que satis-
facen la ecuación de Hermite (4.12-16). La demostración de esto se propone como
ejercicio para el lector.
Las funciones de onda reales l/ln(x) se obtienen de las soluciones polinómicas
de la ecuación de Hermite por medio de ( 4.12-15) y (4.12-1 0), siendo el resultado

(4.12-30)
El oscilador armónico unidimensional 117

en donde a está dada por (4.12-8) y en donde la constante de normalización Nn se


escoge de tal manera que

Se puede demostrar 9 que esta condición requiere que

(4.12-31)

Las funciones de onda dependientes del tiempo 'l{ln(x, t) se obtienen a partir


de las expresiones de (4.12-30) multiplicándolas por el factor e-ientfñ, de acuerdo
con (4.8-7).
Puesto que más adelante se compararán las propiedades del oscilador cuántico
con las de su equivalente clásico, conviene analizar brevemente algunas características
del oscilador clásico y, sobre todo, se debe calcular la distribución de probabilidad
asociada con éste. Dado que el desplazamiento x(t) de la partícula clásica es como
lo establece (4.12-4), se sigue que la energía cinética y la potencial del oscilador
clásico están dadas, respectivamente, por

de donde, la energía total debe ser

(4.12-32)

Esta ecuac10n se puede resolver para A en función de e, dando A= ..J2e/mw~,


y, si se supone que la energía tiene el valor (n +-t)hw 0 (como debe ser en el caso
del oscilador cuántico con el que se desea establecer una comparación directa), se
obtiene, para la amplitud del oscilador clásico con esta energía

A = J(T,J+i)h = J2n + 1 , (4.12-33)


mw 0 ex
en donde a está definida por ( 4.12-8).
La amplitud de probabilidad es la probabilidad de encontrar la partícula dentro
de una región dada dx alrededor del punto x. Para el oscilador clásico, esto es
sencillamente, la razón del tiempo dt que la partícula pasa en esta región durante el
curso de una vibración, al periodo de oscilación T( = 27r/w0 ). Puesto que dx = v(x) dt,
el tiempo que permanece la partícula en este intervalo durante un periodo es

2 d t_-2dx
- (4.12-34)
v(x)'

9 D. Bohm, Quantum Mechanics, Prentice-Hall, Englewood Clit'fs, N. J. (1951), página 305.


118 Mecánica cuántica. Generalidades

ya que pasa dos veces por la región durante un periodo completo de movimiento.
Dado que, de acuerdo con (4.12-4), v(t)=dx/dt=Aw 0 cos(w 0 t- 8), y, puesto que
w 0 t- 8 =sen - l (x/A)= cos- 1 (1- (x/A)2)lf2, v se puede expresar en función de x
por medio de
-~2
v(x) = Aw 0 J 1- A 2 • (4.12-35)

La fracción de tiempo que pasa en dx es P(x) dx, en donde P(x) es la ampli·


tud de probabilidad clásica correspondiente a la cantidad cuántica 1/J*l/J. En vista de
que esta cantidad es igual a 2dt/T, debido a lo que establece (4.12-34) y la relación
T = 21T/w 0 , se tiene que

(4.12-36)

Si se usa (4.12-33), la amplitud de probabilidad de un oscilador clásico que


-t
tiene una energía (n + )líw 0 se convierte en

(4.12-37)

Esta cantidad se comparará con las amplitudes de probabilidad cuánticas 1/J~l/Jn


obtenidas a partir de ( 4.12-30).
En la figura 4.18 se ilustra el comportamiento general de las funciones de
onda correspondientes al oscilador armónico. Se observará que también en este caso
la función de onda penetra en la región más allá de los límites de amplitud del
movimiento clásico. Además, como se puede esperar, debido al hecho de que V(x)
es una función par de x, las funciones de onda son, dternadamente, funciones pares
e impares de x para valores ascendentes de n. Para el estado de energía más baja, la
amplitud de probabilidad clásica calculada a partir de (4.12-37), y representada por
la curva punteada en la figura, no se parece en absoluto a la amplitud de probabi-
lidad desde el punto de vista de la mecánica cuántica. La amplitud de probabilidad
clásica predice que la partícula tiene una mayor tendencia a encontrarse cerca de los
extremos de la región de movimiento permisible, en tanto que el resultado cuántico
predice que es más posible encontrarla en el centro. Sin embargo, para un estado de
mayor amplitud y de una energía correspondientemente más alta, se encuentra una
coincidencia aceptable entre las distribuciones de probabilidad clásica y cuán tic a,
aparte del hecho de que, como es normal, la amplitud cuántica de probabilidad
oscila con gran rapidez alrededor de un valor medio semejante al resultado clásico.
Conforme la amplitud y la energía relacionadas con el movimiento se hacen detec-
tables en una escala macroscópica, los resultados cuántico y clásico no son apre.cia-
blemente diferentes. Normalmente existen puntos a lo largo de la trayectoria clá~ca
de la partícula, en donde la probabilidad de encontrarla, según lo predice la amJ}li-
tud de probabilidad cuántica, se hace sumamente pequeña.
Ortogonalidad de las funciones propias 119

1 '1
1 1
1 1

''1
11
1 ¡1
1
1
,.
11 1
1
ti
1
\
''
n nn /
1

-- -- - - -
/
'- / : 1
' ' '
~

j lJ :\ e
o 6
( b)

Figura 4.18. (a) Funciones de onda de los estados de energía más bajos del oscilador armónico
cuántico unidimensional. (b) Amplitudes de probabilidad cuánticas (curvas conti-
nuas) y distribuciones de probabilidad clásicas (curvas punteadas) correspondientes
al o~cilador armónico unidimensional para dos valores de energía, if:wo y lf.l':wo.
[Tomado de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics,
McGraw-Hill, Nueva York (1935).]

4.13 ORTOGONALIDAD DE LAS FUNCIONES PROPIAS


Y LA SUPERPOSICION DE ESTADOS

Se puede demostrar que las funciones propias de la ecuación unidimensional de


Schrodinger que satisfacen los requisitos físicos de las funciones de onda, presentan
siempre la propiedad de ortogonalidad, es decir, que obedecen siempre la ecuación

J~oo 1/1!1/Jn dx =O (m# n)


(4.13-1)
=l (m= n).
120 Mecánica cuántica. Generalidades

Estas relaciones son una propiedad característica de la ecuación de Schrodinger


y las condiciones de frontera, y se ha encontrado que se aplican sea cual fuere la
función de potencial V(x) y sin que tampoco importe la forma matemática que
tengan las funciones de onda. Que esto es nece~ariamente cierto, se puede com-
probar escribiendo la ecuación unidimensional de Schrodinger para 1/1 n,

(4.13-2)

y la ecuación de onda 1/1~, que, de acuerdo con (4.7-12) y (4.8-6), debe ser
d 2 t/l* 2m
dx 2m - ¡r [em - V(x)]t/l!(x) =O. (4.13-3)

Si la primera ecuación se multiplica por 1/1 ~, y la segunda por 1/1 n, se restan


ambas ecuaciones y se integra de oo a - oo, se obtiene

(4.13-4)

El integrando del término del lado izquierdo de esta ecuación se puede expre-
sar como la derivada de 1/l~(dl/ln/dx) -- 1/ln(dl/1~/dx) con respecto a x, de donde,
( 4.13-4) se convierte en

(4.13-5)

Para funciones de onda con un buen comportamiento físico, 1/1 y dl/1/dx tien-
den a cero conforme x ~ ± oo; por tanto, la cantidad de la izquierda desaparece en
los dos puntos extremos y

(4.13-6)

Si se supone que las funciones de onda 1/1~ y 1/ln pertenecen a dos niveles de
energía diferentes, de tal manera que En =1= Em, entonces, se puede satisfacer (4.13-6)
si y sólo si

(m '# n). (4.13-7)

Para m= n, se pierde el factor En -En en (4.13-6); en este caso, de acuerdo


con la forma en que se definen las funciones de onda ( 4.8-1 0), se debe tener

(4.13-8)

Así pues, las funciones dr onda 1/lm, 1/ln exhiben la propiedad de ortogona-
ltdad. La prop1cdad de ortogonalidad no está restringida a las soluciones de la ecua-
ción de Schrodint'cr. sino que tamhién se relaciona con las soluciones características
Ortogonalidad de las funciones propias 121

de una gran clase de ecuaciones diferenciales, incluyendo la de calor, la de la cuerda


vibrante y las ecuaciones de ondas electromagnéticas. Se puede ver que las funciones
de onda (4.10-10) asociadas con un pozo de potencial infinitamente profundo, satis-
facen las condiciones de ortogonalidad ya que, como se sabe y se puede comprobar
fácilmente,

f0
L mnx nnx
sen - - sen - - dx = O.
L L
(m -:F n) (4.13-9)

Aunque es más difícil hacer la misma demostración para el pozo finito y para el
oscilador armónico, es cierto que las funciones de onda (4.11-5, 6, 7) y (4.12-30)
que pertenecen también a estos sistemas son también ortogonales. 1 0
Supóngase ahora que se tiene un conjunto infinito de funciones propias 1/Jn(x)
que son soluciones a la ecuación de Schrodinger para un potencial dado V(x). Ya se
dijo que estas funciones propias deben ser ortogonales y normalizadas de acuerdo
con (4.8-10), de manera que obedecen a (4.13-1). Se pueden combinar estas fun-
ciones propias en una superposición lineal, de modo que la suma represente una
función arbitraria de x, sujeta a ciertas restricciones matemáticas que no son muy
severas. Para entender cómo se hace esto, supóngase que una función arbitraria f(x)
se puede representar como la combinación lineal de las funciones propias de tal
manera que
<Xl

f(x) = L ant/Jn(x).
n=O
(4.13-10)

Al multiplic<!T esta ecuación por 1/J~(x) e integrar, se encuentra que

(4.13-11)

En la suma, todas las integrales son cero por virtud de (4.13-1 ), excepto
aquella para la que n = m, que da un valor de am. El resultado final es

(4.13-12)

Si se substituye este valor en lugar de am ( 4.13-1 0), es obvio que f(x) se


puede respresentar como

(4.13-13)

en donde la variable ficticia de integración x' se substituyó con x para evitar confu-
siones.
Para las funciones propias senoidales de la sección 4.1 O, sucede que, esta ex-
pansión es simplemente una expansión de serie de Fourier. Se pueden efectuar

10 /bid., página 219. Véase también R. V. Churchill, Fourier Series and Boundary Value
Problems, McGraw-Hill, Nueva York (1941), páginas 46-52.
122 Mecánica cuántica. Generalidades

expansiones similares en términos de las funciones de Hermite asociadas con el


oscilador armónico, y en términos de otras funciones de onda relacionadas con otras
funciones de potencial. En la sección 4.9 se vio un ejemplo de una situación en la
que los valores propios y las funciones propias están distribuidos en una forma
continua, en lugar de discreta. En este caso se encontró que una función arbitraria
se podía representar como una combinación de integrales de las funciones propias,
de la forma de una integral de Fourier. Este resultado se puede extender a las
funciones propias que representan cualquier sistema cuyos valores propios tienen una
distribución continua, y el resultado se puede expresar como la ecuación (4.13-13)
en el límite en el que los valores propios se amontonan o concentran, después de lo
cual la suma en dicha ecuación se convierte en integral. Aunque esta representación
integral es importante y hay que mencionarla como dato complementario, no se
analizará en detalle, ya que no se utilizará en esta sección. Su aplicación al caso de
las funciones propias de la partícula libre puede verse con claridad en la exposición
de la sección 4.9.
La combinación lineal de las funciones propias tales como (4.13-1 O) no consti-
tuye una solución a la ecuación de Schri:idinger, independiente del tiempo relacionada
con algún valor particular de energía en, ya que ha perdido la forma (4.8-7); pero, una
combinación lineal de las funciones propias dependientes del tiempo de la forma

00 00

f(x,t) = L an'1' n<x,t) = L ani/Jix)e-i""''ll, (4.13-14)


n=O n=O

que se reduce a (4.13-10) para t =O, es efectivamente una solución para la ecuación
de Schri:idinger dependiente del tiempo, (4.7-3). Esto se puede verificar de un modo
directo con gran facilidad considerando el hecho de que las funciones propias inde-
pendientes del tiempo 1/Jn obedecen siempre, de acuerdo con (4.8-8), a la relación
.tf 1/Jn =En 1/Jn. Esto permite ver que, aunque se puede construir una superposición
de funciones de onda, que obedezcan a la ecuación de Schri:idinger dependiente del
tiempo, para representar cualquier función o amplitud de probabilidad en un instante
dado (t = O en el ejemplo anterior), en general, la superposición de las funciones de
onda no stgue representando esa misma función o amplitud de probabilidad en
tiempos posteriores, debido a las diferentes dependencias del tiempo de las compo-
nentes individuales de dicha superposición. Así pues, una superposición de funciones
de onda no representa por lo general un estado estacionario del sistema. Este tema
ya se tocó en la sección 4.8.
Si una superposición de funciones propias, tales como (4.13-14), va a utilizarse
como cualquier tipo de función de onda para un sistema físico, es necesario norma-
lizarla para que satisfaga ( 4. 7-6). Por tanto, para funciones de onda de la forma
(4.13-14), se debe tener

(4.13-U)

En vista de los establecido por {4.13-1 ), todos los términos de la doble suma
son cero, excepto aquellos para los que m = n, en donde el valor de la integral es
igual a la unidad. En consecuencia, se encuentra que el requisito de normalización
quedará satisfecho a condición de que los coeficientes se escojan de tal modo que

(4.13-16)
Valores esperados y números cuánticos 123

4.14 VALORES ESPERADOS Y NUMEROS CUANTICOS

Supóngase que se hace un gran número de mediciones de una cantidad física f


que es una propiedad de un sistema dinámico dado. Estas mediciones se hacen
siempre sobre el mismo sistema o en sistemas idénticos que se encuentran siempre
en el mismo estado. Si se conserva la propiedad f, es decir, si es constante con
respecto al movimiento de dicho sistema, entonces (dentro del error experimental
que se supondrá despreciable), se obtendrá el mismo valor de f en cada medición, y
si se traza una gráfica de la frecuencia P(j) df con que se obtiene un valor medido en
un rango df alrededor de f, será simplemente un "pico" localizado en un valor dado
/ 0 , que constituye el valor esperado <ft. Esta situación se ilustra en la figura 4.19(a).
Si la propiedad f no se conserva en el movimiento, se puede esperar obtener resul-
tados diferentes en cada medición y una gráfica de la frecuencia a la que se obser-
van los valores en un rango df alrededor de f, en función de f, presentará una
··ampliación" alrededor de un valor promedio o esperado (ft, como se ilustra en la
figura 4.19(b ). El grado de la ampliación estadística de las mediciones se puede
expresar en términos de la desviación estándar a, que se define como

(4.14-1)

De acuerdo con esto, es evidente que si f es siempre lo mismo que (ft, como
sucede en la distribución "pico" de la figura 4.19(a), entonces, a= O, mientras que
si f y <ft no son siempre iguales, entonces a es la desviación de raíz cuadrada media
de los valores de f en relación con el promedio. La expresión (4.14-1) puede escri-
birse en diferente forma, haciendo notar que

P(f) p (f}

fo <t>
( = <t>l
(al (b}

Figura 4.19. (a) Distribución estadística de muchas determinaciones relativas a una cantidad
que es una constante del movimiento (b) Distribución análoga Lurrespondiente a
una cantidad que no es una constante del movimiento.

le donde,

(12 =<12> - 2(/)(f) + <!>2


= <!2>- (!)2. (4.14-2)
124 Mecánica cuántica. Generalidades

Uno de los postulados fundamentales es que el valor esperado de una cantidad


dinámica está dado por

(f) = f~"' 'P*fop'P dx, (4.14-3)

en donde fop es el operador correspondiente a la variable dinámica f y en donde 'IJ1


representa la función de onda del sistema para el que se mide f Ahora se investi·
garán ciertos valores esperados relacionados con el operador de energía (- h/iXofot),
primeramente, para un sistema en uno de sus estados propios, y luego para el mismo
sistema en un estado que se representa como una superposición de dos estados
propios.
En primer lugar, es obvio que para cualquier sistema, el valor esperado de
energía (e), se puede calcular a partir de la función de onda dependiente del tiempo
'IJ!(x,t) por medio de (4.14-3), utilizando también (4.7-4). El resultado es

(e) = f oo
-oo
Ji
1 ut
o'P)
'P* ( --:--;-- dx, = foo
_ 00
'P*.Jf'P dx = ($). (4.14-4)

El valor esperado de la energía es, entonces, el mismo que el del operador


hamiltoniano evaluado sobre las funciones de onda dependientes del tiempo. Si
'IJ!(x,t) es una función de onda que representa un estado propio estacionario del
sistema y que, por tanto, tiene la forma ( 4.8-7), ( 4.14-4) se puede expresar como
sigue

(4.14-5)

El valor esperado del operador hamiltoniano y, por ende, de la energía es, en


este caso, el mismo cuando se toma sobre las funciones de onda independientes del
tiempo 1/J(x), o bien, que sobre las funciones dependientes del tiempo 'IJ!(x,t). Puesto
que :Tf, de acuerdo con (4.7-5), es un operador independiente del tiempo, no opera
en factores de tiempo en (4.14-5); por tanto, estos factores se pueden mover más
allá del operador :lf y cancelarse entre sí.
Si la función de onda 'IJ!(x,t) es una superposición de las funciones propias de
estado estacionario de la forma ( 4.13-14),

'P(x,t) = L anl/ln(x)e-ient!A, (4.14-6)


"
entonces, de acuerdo con (4.14-4), observando nuevamente que :lf no opera sobre
los factores de tiempo,

(4.14-7)

Si se usa (4.8-8), que indica que :1ft/In= Ent/ln, se tiene

(e) = L L e"e-i(en-em)t/A
m n
f"'
-oo
a!anl/l!l/ln dx, (4.14-8)
Valores esperados y números cuánticos 125

que, en vista de la propiedad de ortogonalidad de las funciones propias, se reduce a

(4.14-9)

todas las integrales de (4.14-8) desaparecen excepto aquellas para las que m= n. Sin
embargo, este es el mismo valor que se obtuvo tomando el valor esperado del
operador hamiltoniano Yf sobre la función de onda independiente del tiempo

t/l(x) = 'l'{x,O) = L a.t/l.(x), (4.14-10)

porque entonces, utilizando ( 4.8-8) y las propiedades de ortogonalidad de las fun-


ciones propias,

= L L a!a.e. foo t/l!t/1. dx = L a:a.e. = (e). (4.14-11)


m n -oo n

El operador Yf que opera sobre la función independiente del tiempo


(4.14-10), es por tanto, totalmente equivalente al operador (-h/iXofot) que opera
sobre la función dependiente del tiempo (4.14-6). Cuando se calculen los valores
esperados para funciones de ondas superpuestas, se usará este resultado que se debe
a la independencia del tiempo del operador Yf y la ortogonalidad de las funciones
propias.
Si el sistema se encuentra en uno de sus estados propios estacionarios, su
función de onda es 1/Jn(x), y, de acuerdo con (4.14-5),

(e)= (Jt") = f~oo .¡,:Jt"t/1. dx = f~oo .¡,:(e.t/1.) dx =e. f~oo t/l:t/1. dx =e•.
(4.14-12)

De igual manera, el valor esperado de e2 se puede determinar evaluando el


operador correspondiente independiente del tiempo :lf 2 sobre la función de onda
independiente del tiempo,l 1 según lo cual

La desviación estándar asociaJa con una serie de determinaciones de energía


sobre un sistema, en uno de sus estados propios estacionarios será, de acuerdo con
(4.14-2), (4.14-12) y (4.14-13)

(4.14-14)

11 Estrictamente hablando, este enunciado se debe (y se puede) demostrar mediante los


métodos usados para derivar (4.14-9) y (4.14-11).
126 Mecánica cuántica. Generalidades

Entonces, se obtendrá una distribución "pico" en donde cada medición dará el


mismo valor de energía en.
Ahora se supondrá que la función de onda del sistema es una superposición de
dos funciones propias, de la forma

(4.14-15)
de tal manera que

(4.14-16)

en donde, de acuerdo con (4.13-16),

(4.14-17)

El valor esperado de la energía se puede evaluar ahora calculando el valor


esperado del operador :if sobre la función de onda (4.14-16). Por supuesto, los
resultados se pueden obtener como un caso especial de (4.4-11),.por ló cual

(4.14-18)
en donde

and 1 -a.= a:an. (4.14-19)

Del mismo modo, el valor esperado de e2 se puede determinar evaluando


:ff 2 y empleando la función de onda (4.14-16), lo cual da

(.Yt' 2 ) = f~.., (a!t/1! + a:t/f:)Jf.Yf(amt/Jm + ant/Jn) dx

= f~..,a!amt/J!.Yf(.Yft/lm) dx + f~.., a:ant/J:.1f(.Yft/ln) dx

+ f~.., a!ant/J!.Yt'(.1ft/ln) dx + f~oo a:amt/J:..it'(.rt't/lm) dx. (4.14-20)

Sin embargo, .rt'l/lm = em 1/lm y Hl/ln =en 1/ln; al aplicar estas fórmulas dos
veces a cada una de las cuatro integrales de ( 4.14-20) se obtiene

(4.14-21)

Las dos primeras integrales de (4.14-21) son la unidad y las otras dos son
cero, debido a la ortogonalidad de las funciones propias 1/Jn. La ecuación se reduce.
en este caso, a

(4.14-22)
Valores esperados y números cuánticos 127

La desviación estándar asociada con mediciones de energía en un sistema cuya


función de onda es la superposición (4.14-15), es

(4.14-23)

La desviación estándar es cero sólo cuando a = O, a = 1, ó em = en; en cada


uno de estos casos, la función de onda ( 4.14-16) se reduce a una sola función
propia del sistema. Sin embargo, en general, se tendrá cierto "despliegue" relacio-
nado con mediciones de energía de un sistema de esta índole, en donde las determi-
naciones no dan siempre el mismo valor de energía. En realidad, si se piensa un

P(•)

Figura 4.20. Distribución estadística de energías para sistemas cuyas funciones de onda son
superposiciones de las mésima y nésima funciones propias

poco, se verá que la distribución de frecuencia de "dos picos" de la figura 4.20


coincide con los valores de (e) y (e 2 ) dados por (4.14-18) y (4.14-22). Si se estudian
los valores esperados de potencias más altas de e, se llegará a la conclusión de que
sólo esta distribución es consistente con todos los valores esperados. 12 En la actua-
\\d.ad., \a \n.terpretadón. -pteva.\ec¡,den.te de este resultado es o,.ue, cuando se mide la
energía en un sistema, el acto mismo de la medición hace que el sistema pase a uno
de sus estados propios, si no está ya en uno de ellos, y que la probabilidad de que
el valor medido de la energía esté asociado con uno u otro estado propio, es propor-
.::ional a la cantidad a~am relacionada con el estado propio en la función de onda
de superposición.
Si la cantidad a 2 asociada con el valor esperado de cierta cantidad dinámica es
.::ero, se dice que esa cantidad se conserva en el movimiento o que es una constante
del movimiento. De acuerdo con (4.14-14), es evidente que se conserva la energía de
"Jn sistema en uno de sus estados propios. Si se puede encontrar un operador A con
la propiedad de que

(4.14-24)

12 C. W. Sherwin, op. cit. páginas. 118-122.


128 Mecánica cuántica. Generalidades

en donde An es una constante, se dice que An es un valor propio del operador A.


Para tal operador,

(4.14-25)

(4.14-26)

por lo cual,
(4.14-27)

y la cantidad dinámica representada por A se conserva, y el valor esperado del


operador A está dado por el valor propio An· Evidentemente, el operador hamil-
toniano Jf es tal, que sus valores propios son las energías En· Cualquier otro
operador A, que posea la propiedad (4.14-24) con respecto a las funciones propias
del sistema, conmutará siempre con el operador hamiltoniano, es decir, siempre se
encontrará que
AJf =ffA, (4.14-28)
ya que, entonces,
Jt' Al/In= Jt'().nl/ln) = AnJfl/ln = AnBnl/ln (4.14-29)

y
A.tfl/ln = A(enl/ln) = enAI/1. = enA.nl/ln = ff Al/In· (4.14-30)

La inversa de este enunciado es verdad también; si un operador A conmuta


con el operador hamiltoniano, como sucede en (4.14-28), el operador tiene la pro-
piedad ( 4.14-24) con respecto a las funciones propias 1/1 n, y la variable dinámica que
representa es una constante del movimiento ya que en este caso se satisface
( 4.14-27),13
Cuando se trata de sistemas más complejos, tales como el átomo de hidrógeno,
que se estudia en la siguiente sección, las relaciones (4.14-24) y (4.14-28) son muy
útiles para demostrar que ciertas cantidades dinámicas son constantes del movi-
miento. Se constatará, recurriendo a (4.14-24), que el total de la cantidad de mo-
vimiento angular orbital del electrón dentro del átomo de hidrógeno, y su compo-
nente z, son constantes del movimiento.

4.15 EL ATOMO DE HIDROGENO

El átomo de hidrógeno es un sistema compuesto de un protón y un solo


electrón que interactúan como resultado de su atracción electrostática mutua. El
potencial clásico de este sistema es, sencillamente,
V(r) = - e2 /r, (4.15-1)
13 Si se desea ver la demostración inversa ·de esta expresión, véase E. Merzbacher, op. cit.,
página. 160.
El átomo de hidrógeno 129

en donde e es la carga electrónica y r la distancia entre el electrón y el protón. En


este estudio se considerará que la masa del protón es infinita en comparación con la
del electrón. En esta aproximación, cualquier movimiento del protón puede consi-
derarse como despreciable, ya que se supone que el movimiento es el que realiza el
electrón alrededor de un núcleo fijo. Puesto que la masa del protón es alrededor de
1850 veces la del electrón, esta aproximación es aceptable. El movimiento del pro-
tón se puede tomar en cuenta si se utiliza una masa reducida, como se hizo en el
análisis de la sección 4.5 en relación con el átomo de Bohr.
Considerando la simetría esférica del potencial (4.15-1) conviene usar el sistema
de coordenadas esféricas ya conocido, donde

x = r sen Ocos rjJ

y = r sen Osen rjJ

z = r cosO,

Figura 4.21. Sistema de coordenadas esféricas utilizadas en el estudio del átomo de hidrógeno.

como se ilustra en la figura 4.21, en donde se puede escribir la ecuación inde-


pendiente del tiempo de Schrodinger como

(4.15-2)

con

(4.15-3)

En (4.15-2), m 0 representa la masa del electrón.


Se puede proceder mediante la técnica ya conocida de separación de variables,
en la que se supone que las soluciones tienen la forma

1/J(r,O,r/J) = R(r)E>(O)<'P(r/J), (4.15-4)


130 Mecánica cuántü:::. Generalidades

en donde R(r) es una función de r solamente, independiente de 8 y 1/>; 8(8) es una fun-
ción sólo de 8, y cl>(if>) es una función exclusiva de 1/>. Al substituir esta forma para la
solución, en (4.15-2), observando que 3¡J¡f3r = 0cl> dR/dr, 31/1/38 = Rcl> d0/d8 y 31/1/31/>
=R@Jd~/dl/>, multiplicando la ecuación resultante por r2 sen 2 8/(R~), y transpo-
niendo, se tiene que

Puesto que la expresión de la izquierda, que es una función solamente de r y


8 es igual a otra expresión que es una función exclusiva de 1/>, las dos expresiones se
deben igualar por separado a una constante que, por razones que se verán en breve,
se representará por medio de m 2 .
A continuación se limitará el estudio, por un momento, a la última igualdad
que aparece en (4.15-5). Esta se puede reacomodar ligeramente de tal modo que se
lea

(4.15-6)

que es una ecuación diferencial cuya solución se puede escribir como sigue

(4.15-7)

Puesto que la función de onda completa ¡J¡ debe tener un solo valor, es
necesario que cl>m(l/>) tenga un solo valor también. En otras palabras, es necesario
que

(4.15-8)

por lo que, de acuerdo con (4.15-7),

o bien,
e±2,.mi =l. (4.15-9)

Esta condición se puede satisfacer sólo si m es un entero positivo o negativo o


bien, cero. Los valores permisibles de m están limitados, entonces, a

m= O, ±1, ±2, ±3, ···,

de otra manera, la función de onda tendrá múltiples valores. Ahora se comprenderá


por qué la constante de separación se escogió de tal manera que se representara
mediante m 2 • Si m es un número real, entonces m 2 debe ser positiva. Si la cons-
tante de separación de ( 4.1 S-5) hubiera sido negativa, las soluciones ( 4.1 S-7) habrían
sido exponenciales y no sinusoidales y la condición de valor único (4.15-8) nunca se
habría satisfecho. Así pues, la constante de separación se escogió de este modo para
asegurar que tendría siempre un valor positivo y, por ende, excluyera inmediata-
mente las soluciones indeseables.
El átomo de hidrógeno 131

En (4.15-5), la expresión de la izquierda se puede igualar a m 2 , y la ecuación


resultante dividirse entre sen 2 fJ y reacomodarse en tal forma que se exprese como
sigue

2 2 2
1-
- d (r2 dR)
- +2m- 0r ( e)
- e+- = - - -1- - sde( n ( )
dE>)
- +--m =fJ,
R dr dr li 2 r E> sen O d() d() sen 2 ()
(4.15-10)

Una vez más, puesto que la primera expresión es una función exclusiva de r y
la segunda lo es sólo de fJ, las dos deben ser iguales, independientemente, a una
constante {3. La segunda igualdad de (4.15-10) se puede escribir en la forma

1 d ( dE>) m 2 E> (4.15-11)


sen() dO sen() d() - sen 2 () + {JE>(O) = O.

Esta ecuación es muy conocida en la física matemática y se denomina ecuación de


Legendre. Sin entrar en muchos detalles matemáticos, 14 se observará que las únicas
soluciones de esta ecuación que no violan los requisitos de lo fmito para las fun-
ciones de onda son aquellas para las que {3 tiene valores de O, 2, 6, 12, 20, • • • , de
donde, para aquellas en que

fJ = l(l + 1) con (l = 0,1,2,3, · · · ). (4.15-12)

En estos casos, las soluciones de (4.15-11) se reducen a un polinomio en cos fJ


y sen fJ más o menos en la misma forma en que las soluciones de la ecuación de
Hermite se reducen a polinomios en ciertas condiciones. Estas soluciones polinómicas
se pueden representar como las funciones asociadas de Legendre P'f(8), definidas por
dlml
Pr(()) =senlml () d(cos O)lml P,(cos O) (4.15-13)

en donde
1 d 1(cos 2 ( ) - 1)'
P,(cos ()) = 211! d(cos 6)1 (4.15-14)

Las funciones P1 (cos fJ) son las llamadas polinomios de Legendre, las primeras
de las cuales son

P 0 (cos O)= 1

P¡{COS ()) = cos ()


(4.15-15)
P 2 (cos O)= t(3 cos 2 ()- 1)

P 3 (cos 9) = !(5 cos 3 ()- cos 9)


etc.

14 Por ejemplo, véase R. B. Leighton, Principies o[ Modern Physics, McGraw-Hill Book Co.,
Inc., Nueva York (1959), página 168.
132 Mecánica cuántica. Generalidades

Por supuesto, cuando m= O, las funciones asociadas P?(e) se reducen a los


simples polinomios de Legendre P1( cos 8). La función E>( 8) de ( 4.15-11) se escribe
casi siempre en la forma

0 (8) = J(2l + l)(l- m)! pm(e) (4.15-16)


lm 2( 1 + m) ! 1 ,

siendo el factor de multiplicación Pf(8) una constante de normalización. La parte


angular de la función de onda, representada como un producto de 8 1m(8) y <I>m(cf>)
se escribe con frecuencia en la siguiente forma

= ( -l)m J( 21 + 1)(l- m)l. Pr(e)eim<J>.


4n(/ +m)!
(4.15-17)

Las funciones Y 1m (e ,e/>) se conocen como armónicas esféricas. Para una fuerza
central en donde el potencial es una función exclusiva de r, la parte angular de la
función de onda está dada siempre por ( 4.15-17), sea cual fuere la forma particular
que tome V(r).
La porción radial de la ecuación ( 4.15-1 O), tomando ~ = l(l + 1) como lo re-
quiere ( 4.15-12), se convierte ahora en

_1_ .!!_ (r 2 dR) + 2m 0 (s + e 2 )R(r) _ 1(1 + 1)R(r) =O. (4.15-18)


r 2 dr dr li 2 r r2

Esta expresión se denomina ecuación de Laguerre. Las soluciones cuyo compor-


tamiento en r = oo permite calificarlas como funciones de onda, son aquellas que se
pueden expresar en términos de los polinomios de Laguerre. Estas funciones con las
que se asocia un conjunto discreto de valores propios de la energía E, se pueden
expresar como sigue

_ _
Rnl(r)-
[(2 nli2 2)3
moe (
. n- 1 -
(2n[n +
1)' ]1/2 e
·
/] !)3
-p¡z 1 zt+ 1
p Ln+l (p), (4.15-19)

en donde
11 = 1,2,3, .... (4.15-20)
y en donde
(4.15-21)

Las funciones L ~':/(p) son funciones asociadas de Laguerre, definidas por


ds
L~(p) = -1S L,(p), (4.15-22)
(p

en donde Lr(P) son los polinomios de Laguerre que, a su vez, se definen como
d'
L,(p) = eP - ,(p'e-P). (4.15-23)
(1p
El átomo de hidrógeno 133

Las energías en para las que existen funciones de onda aceptables están rela-
cionadas con los valores de n en (4.15-19) por medio de 15

(4.15-24)

La ecuación ( 4.15-24) para los niveles de energía del átomo de hidrógeno


concuerda con el resultado ( 4.5-8) de la teoría de Bohr; los niveles energéticos,
según se ilustran en la figura 4.5, y dados por la teoría de Bohr son los mismos que
los que predice la mecánica ondulatoria.
Existen tres números cuánticos, n, l y m en el planteamiento de la mecánica
ondulatoria para el átomo de hidrógeno. Los valores posibles de n están dados por
(4.15-20). Los polinomios de Laguerre Lr(P) de (4.14-23) se pueden identificar como
polinomios de grado r. Estos polinomios se pueden derivar sólo r veces antes de que
el resultado de la derivación repetida dé cero como resultado. De donde, para las
funciones de onda que no sean cero de la forma L:,
que se puedan obtener del
polinomio Lr, el número de derivaciones s necesarias para generar la función aso-
ciada L: de acuerdo con (4.15-22), debe ser igual o menor que r. Entonces, para
funciones de onda con significado físico, es necesario tener en (4.15-22)

s ~ r, (4.15-25)
o, en (4.15-19)
21 + 1 ~ n +l. (4.15-26)
Si se resta l +1 en ambos lados de esta desigualdad, (4.15-26) se reduce a

l~n-1. (4.15-27)

De igual manera, la función asociada de Legendre P{'(fJ) se obtiene del poli-


nomio de Legendre P1(cos fJ) mediante una derivación de m veces. Para una función
de onda distinta a cero de la forma P{'(fJ), el número de derivaciones m debe ser
igual o menor que el grado l del polinomio. Por tanto, se debe tener

(4.15-28)

para funciones de onda de interés físico. Las condiciones expresadas en (4.15-20),


( 4.15-27) y ( 4.15-28), sirven para definir las expresiones bien conocidas para el
rango posible de valores correspondientes a n, l y m,

n = 1,2,3,4, ···

l = 0,1,2,3, ··· n- 1 (4.15-29)

m =0,±1,±2,±3, ···±l.

Por lo común los estados para los que l = O, 1, 2, 3 se mencionan como es-
tados s, p, d y f, respectivamente. Así pues, para indicar un estado para el que n = 2
y l =O, se dice estado 2s, en tanto que uno con n = 3 y l = 2 se representa como
estado 3d.

15 Los detalles matemáticos de este desarrollo están dados por R. B. Leighton, op. cit.,
páginas. 171-17 5.
134 Mecánica cuántica. Generalidades

Las funciones de onda completas para el átomo de hidrógeno, de acuerdo con


lo establecido en ( 4.15-4), deben ser

(4.15-30)

en donde Rn 1(r), E>,m(l1>, y <~~m(C/>) son según lo establecen, respectivamente,


(4.15-7), (4.15-16) y (4.15-19), y en donde Nnlm es una constante de normalización
seleccionada en tal forma que

f 1/J:,ml/lnlm · r 2senO dr dO df/J =l. (4.15-31)

Se encuentra que las funciones de onda (4.15-30) son ortogonales, de modo


que

f 1/J:I'm'l/lnlm · r 2 senO dr d(J df/J =O, (4.15-32)

a menos que n = n', l = l' y m= m' simultáneamente. Las funciones de onda depen-
dientes del tiempo se o_btienen a partir de las funciofles independientes del tiempo y
multiplicándolas por e- 1 ent/fl.

TABLA 4.1.
Funciones de onda del átomo de hidrógeno

n=1 1=0 m=O .P1oo = Nlooe-'hP 1s

n=2 1=0 m=O .P2oo = N2oo(2- p)e-'hP 2s


1=1 m=O .P21o = N21ope- 'hP cos 8
} 2p3
(4 estados) m=±1 .P21±1 = N211pe-~'>P sen8 e± 1"'

n=3 1=0 m=O .P3oo = N3oo(6- 6p + p2)e- 'hP 3s


1= 1 m=O .P31o = N31op(4- p)e- 'hP cos 8
} 3p3
m=±1 .P3t±1 = N311p(4 -p)e-'l.zP sen8 e± 1•
1=2 m=O .P32o = N32op 2e_ 'hP(3 cos 2 8- 1)
m=±1 .P32± 1 = N321p 2e- 'hP sen8 cos 8 e± 1"' ) 3d'
(9 estados) m=±2 if¡ 32 ±2 = N 322 p2e- 'lzP sen 2 8e±Z1"'

n=4 1=0 m=O .P4oo = N4oo(24- 36p + 12p 2 - p3)e- 'hP 4s


l= 1 m=O .P4to = N4tope- 'hP(20- 10p + p2) cos 8
} 4p3
m=±1 .P4t±l = N411pe-'lzP(20- 10p +p 2) sen8 e± 14>
1=2 m=O .P4zo = N42oP 2(6 -p)e- 'hP(3 cos 2 8- 1)
.P42±1 = N42tP 2(6 -p)e-'hPsen8 cos 8 e± 1•
m=±1
m=±2 .P4z±Z = N4••P 2(6- p)e-'l.zP sen 2 8 eu 1•
)4d'
1=3 m=O .P43o = N43op 3e-'hP(j-cos 3 8- cos 8)

(16 estados)
m=±1
m=±2
m=±3
.p43±1 = N43tp 3e- 'h•(5 cos 2 8- 1) sen 8 e± 1"'
.P43±2 = N432p 3e-'h.Psen 2 8 cos 8 e± 21 "'
.P43±3 =N433p 3e-'hPsen 3 8 e± 3'"'
}·;,
N = _ [ cmoe 2 ) 3 (n -1- 1)!(/- m)!(2/ + 1)]'/.z
nlm nli' 4rr(2n[n + /]!) 3(/ + m)!
El átomo de hidrógeno 135

Figura 4.22. Representaciones fotográficas de la densidad de electrones asociada con varios


estados propios del átomo de hidrógeno. El eje polar yace sobre el plano de la
página y está orientado verticalmente.

De acuerdo con (4.15-24), es evidente que la energía depende sólo del número
cuántico principal n de este sistema particular. Existen muchos estados cuánticos
independientes [correspondientes a los diversos valores permisibles para l y m, de
acuerdo con (4.15-29)], que tienen el mismo número cuántico principal n y que, por
tanto, pertenecen al mismo nivel de energía. Este fenómeno se conoce como degene-
ración y un nivel energético que contiene más de un estado cuántico independiente
se conoce con el nombre de nivel degenerado. Gracias a ( 4.15-29), se puede ver
mediante un simple recuento de los estados, que la degeneración o multiplicidad
asociada con el nivel de energía En, cuyo número cuántico principal es n, es sim-
plemente n 2 •
Las expresiones algebraicas para algunas de las funciones de onda del átomo de
hidrógeno se ilustran en la tabla 4.1 y, en la figura 4.22 se muestran algunas repre-
sentaciones de la densidad de probabilidad de algunos de estos estados. Se observará
que los estados s- (l = O) son siempre esféricamente simétricos, en tanto que los
estados p-, d- y f, etc., tienen dependencias angulares que pueden ser muy com-
plejas. El estado 2p- para el que m = O, tiene dos lóbulos que señalan hacia las
direcciones ± z, en tanto que los estados 2p- para los que m = ± 1 tienen la forma
de "ondas" y son simétricos alrededor del eje z. Por tanto, todos los estados 2p-
136 Mecánica cuántica. Generalidades

Figura 4.22. (continúa). La escala no es uniforme en todos los diagramas. [Tomado de R. B.


Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).]

tienen amplitudes de probabilidad que son simétricas alrededor del eje z. Se podría
preguntar cuál es la razón de esta aparente preferencia por el eje z. Después de
todo, el potencial V(r) es esféricamente simétrico, lo cual permite en primer lugar
escoger cualquier eje polar del sistema de coordenadas esféricas, y se seleccionó éste
de un modo puramente arbitrario. Entonces, ¿por qué parece que este aspecto es en
apariencia preferible o, más concisamente, se prefiere en realidad este eje en un
sentido físico?
En la sección 4.13 se hizo notar que las superposiciones lineales de las fun-
ciones ondulatorias en estado estacionario que pertenecen a diferentes niveles de
energía, no representan amplitudes de probabilidad que son independientes del tiem-
po. Puesto que las diversas funciones propias de estado estacionario independientes
que pertenecen al mismo grado energético degenerado tienen el mismo factor de
dependencia del tiempo e-iEntffi, sin embargo, se sigue que los estados de esta
naturaleza pueden superponerse y la amplitud de probabilidad de la superposición
sigue siendo independiente del tiempo. En la sección 4.10 se vio un ejemplo de este
tipo [en relación con la ecuación (4.10-13)]. Por ejemplo, de acuerdo con la ta-
bla 4.1 y (4.15-29) es evidente que existen tres estados independientes 2p para el
átomo de hidrógeno. No obstante, no existe ninguna diferencia si se considera que
El átomo de hidrógeno 137

estos estados son los mismos que se indican en la tabla 4.1 ó si se les toma como
tres superposiciones linealmente independientes de dichos estados. Mediante la super-
posición adecuada de los tres estados dados en la tabla 4.1, se podrían producir tres
funciones de onda independientes en superposición, que correspondan a las ampli-
tudes de probabilidad con lóbulos que señalen a lo largo de los ejes x-, y- y z-, en
lugar del lóbulo polar y la configuración en "dona" de las funciones de la tabla. Si
se hace una superposición lineal adecuada y subsecuente de estas tres funciones de
onda, se puede hacer que estos tres lóbulos señalen en cualquiera de tres direcciones
ortogonales dadas. Esto demuestra que las funciones de onda de la tabla 4.1, en las
que un eje polar arbitrariamente escogido parece tener un grado único o preferencial,
forman sólo una representación de las funciones de onda del sistema y que, a través
de la superposición correcta de estados cuánticos degenerados, se podría formar una
representación en la que el eje polar estuviese en alguna otra dirección. Además, por
supuesto, si así se deseara, se podría superponer el estado 2s a lo largo de los tres
estados 2p. No obstante, no se podría sumar en un estado 3s o 3p y seguir conser-
vando una amplitud de probabilidad independiente del tiempo.

o3/2R/Z
o 3/2 2
1
k
R 10

~
1 1
o 10 15

Figura 4.23. Gráficas de la función de onda radial Rn¡(r) correspondiente a 11lgunos estados del
átomo de hidrógeno. [Tomado de R. B. Leighton, Principies of Modern Physics,
McGraw-Hill, Nueva York (1959).]

En la figura 4.23 se muestra una gráfica de la función de onda radial Rn¡(r)


para varios de los estados de energía más bajos del átomo de hidrógeno, y en la
figura 4.24 se muestra una gráfica de la densidad de probabilidad radial, que es la
probabilidad de encontrar al electrón dentro de una capa esférica de un espesor dr,
alrededor del radio r. Puesto que el volumen de una capa de esta naturaleza es,
138 Mecánica cuántica. Generalidades

47rr2 dr, la densidad de probabilidad radial debe ser proporcional a r 2 R~ 1nl(r). 1


demostración de este aserto se propone como ejercicio para el lector. Los máxim<
en la densidad de probabilidad radial para las funciones de onda s, como se ilust1
en la figura 4.24, son muy semejantes (aunque no idénticas) a los radios de Bot
rn, según lo establece (4.5-4).
Ya se observó, gracias a la ecuación (4.15-24), que el número cuántico pri1
cipal n está asociado con la energía total del sistema. Más tarde se verá que 1<
números cuánticos 1 y m están relacionados con la cantidad de movimiento angul:
del sistema. En el movimiento planetario clásico se conserva la cantidad de mov

25
Zr
o;
Figura 4.24. Gráficas de la distribución de probabilidad radial r2R~ 1 (r) para algunos estado~ d
átomo de hidrógeno. [Tomado de R. B. Leighton, l'rinciples of Modern Physic
McGraw-Hill, Nueva York (1959).]

miento angular orbital. Como se verá en breve, esto se aplica también al plante:
miento de la mecánica cuántica. La cantidad de movimiento angular clásica L de ur
partícula se define por medio de

L = r X p, (4.15-3:

en donde p es la cantidad de movimiento lineal y r es el vector de radio a partir d


un origen arbitrario hasta la partícula. De acuerdo con esta definición y el enur
ciado de los operadores de cantidad de movimiento lineal (4.7-2), se puede construJ
de un modo muy directo un conjunto de operadores que representen las comp<
nentes cartesianas de una cantidad de movimiento angular. El resultado es

L
y
=zp" -xpz =~[z~-x!_]
i OX oz (4.15-3~

L
z
=xpy -yp" =~[x!_-y!_]
i iJy ox .
El átomo de hidrógeno 139

Estos operadores se pueden expresar de acuerdo con las coordenadas esféricas


(r, O, cp) mediante una transformación de coordenadas directa, pero tediosa. En este caso,
los operadores se convierten en

L
x
li[ a - ctn () cos "~',¡,. -a<Pa]
= -¡ - sen "~',~,. -ao

L =
'
~¡ [cos ,¡,."~' ao0 - ctn Osen,¡,.~]
"~' a<P (4.15-35)

li a
L.= i a<P ·
El operador que representa el cuadrado del total de la cantidad de movimiento
angular se puede obtener a partir de (4.15-3 5) como

2
L = Lx
2
+ L,2 +L.=
2
-li
2[ 1 a(
sen OoO sen()
a) o2
ao + sen12 Oa<jJ 2 ] • (4.15-36)

A continuación se examinará lo que sucede cuando este operador opera sobre


las funciones de onda 1/lnlm del átomo de hidrógeno, según lo indica (4.15-30). Se
encuentra que

(4.15-37)

Sin embargo, el operador L 2 es independiente de r y opera sobre la función


de onda producto (4.15-30) en tal forma que (4.15-37) se puede escribir como sigue

(4.15-38)

Si a esta expresión se aplican sucesivamente las relaciones (4.15-6), ( 4.15-11) y


(4.15-12), es evidente que

(4.15-39)

Esta ecuación demuestra que el operador L 2 es tal que tiene la propiedad


especial dada por (4.14-24) con respecto a las funciones de onda 1/lnlm· En conse-
cuencia, de acuerdo con (4.14-27) y (4.14-25), la variable dinámica asociada con el
operador debe ser una constante del movimiento y su valor esperado es h2 l(l + 1).
Así pues, se conserva el cuadrado de la cantidad del movimiento angular, por lo que
la propia cantidad de movimiento angular debe conservarse, y el valor esperado de la
cantidad de movimiento angular debe ser

(L) = J (L2 ) = lijl(l + t). (4.15-40)


140 Mecánica cuántica. Generalidades

En forma similar, se puede demostrar que la componente z de la cantidad de


movimiento angular se conserva también. En este caso, a partir de (4.15-35) y
(4.15-30), se tiene que

li a li a<I>m
Lzt/Jnlm = ¡ oc/J R",(r)E>,m(O)<I>m(cP) = ¡ R",(r)E>,m(O) oc/J • (4.15-41)

Sin embargo, ocfJm/ocp = imeím<P = imcfJm(C/J), de donde (4.15-41) se convierte


en

(4.15-42)

En consecuencia, el operador Lz tiene también la propiedad especial (4.14·24)


y, por ende, Lz es una constante del movimiento cuyo valor esperado debe ser

(4.15-43)

Se conserva tanto el total de la cantidad de movimiento angular como su


componente a lo largo del eje polar (cuya dirección, como ya se vio antes, se puede
escoger de un modo arbitrario). El número cuántico /, que especifica el total de la
cantidad de movimiento angular orbital, se denomina a veces número cuántico or-
bital. El número cuántico m, que especifica la componente z del momento angular,
se llama a veces número cuántico magnético, ya que la degeneración de los estados
que tienen los mismos valores de n y /, pero distintos para m, se pueden eliminar
aplicando un campo magnético.
Las orie'ltaciones posibles del vector de cantidad de movimiento angular L con
las restricciones impuestas por las condiciones cuánticas ( 4.15-40) y (4.15-43), se
ilustran en la figura 4.25 para los estados en los que l = O, 1 y 2. El vector L debe
tener, al mismo tiempo, una longitud total dada por (4.15-40) y una proyección a
lo largo del eje z establecida por ( 4.15-43). Esto da como resultado un grupo
discreto de orientaciones posibles para el vector, como se indica en los diagramas. Es
evidente que estos diagramas pueden generalizarse para aplicarlos a sistemas que
tienen valores más altos de /. También se debe aclarar que, si se aplica un campo
magnético constante a lo largo del eje z, el momento magnético del electrón dentro
de su órbita (que es proporcional al total de la cantidad de movimiento angular

L,="Íi

1=0 /= 1 /=2
L=O L="Íiff L="Íi {6
L,=O, ± "Íi L,=O,±"Íi ±2"Íi

Figura 4.25. Posibles orientaciones para el vector de cantidad de movimiento angular bajo las
restricciones impuestas por (4.15-40) y (4.15-43) para l =O, 1 y 2.
El espín electrónico 141

orbital) tendrá una interacción con el campo aplicado, de modo que el átomo
experimentará una fuerza que trata de alinear al vector del momento magnético (y,
por ende, el vector de su cantidad de movimiento angular orbital) con el campo
aplicado. Por consiguiente, los estados cuyo valor de m permite una alineación par-
.:ial o completa, deben tener una energía más baja que los que corresponden a
orientaciones casi antiparalelas. Los estados cuánticos que tienen dife¡entes valores de
m, los cuales se degeneran en ausencia de un campo magnético, al aplicarles dicho
~po se dividirán en m niveles separados aunque muy proximos uno del otro. Este
fenómeno se conoce con el nombre de efecto de Zeeman.
Estos resultados sirven para explicar adecuadamente las propiedades eléctricas,
magnéticas y espectroscópicas observadas en el átomo del hidrógeno. En principio,
los átomos de estructura más compleja se pueden manejar con los mismos métodos;
por otra parte, puesto que estos átomos representan sistemas de tres o más cuerpos,
no se pueden obtener soluciones analíticas de forma cerrada, debido a lo cual es
necesario recurrir a la teoría de perturbaciones. Un método de esta índole se basa
en la técnica de dividir el operador hamiltoniano del sistema en una parte principal
.:uya solución se conoce o se puede obtener analíticamente, y una parte más pe-
queña que contiene todos los términos que pueden originar dificultades analíticas. O,
por lo menos la mayoría de ellos. Entonces, se supone que la solución tiene la
forma de una combinación lineal de funciones propias de la primera parte del ha-
miltoniano y las constantes relacionadas con la combinación lineal se determinan de
tal modo que la función de onda sea una función propia aproximada del hamil-
toniano completo. Aunque estos métodos son muy útiles para resolver una gran
,·ariedad de problemas prácticos, no se analizarán aquí con más detalle. 16

4.16 EL ESPIN ELECTRONICO, EL PRINCIPIO DE EXCLUSION


DE PAULI Y EL SISTEMA PERIODICO

En el cálculo de las funciones de onda y los niveles de energía de átomos con


muchos electrones (He, Be, Li, etc.,) que se hace desde el punto de vista de la mecá-
nica cuántica, generalmente se supone que cada electrón se mueve dentro de un
potencial esféricamente simétrico, debido al núcleo y a una distribución espacial
promedio de todos los demás electrones. En esta aproximación, la función de onda
total del sistema se puede expresar como un producto de funciones de onda de un
solo electrón. La función del potencial de cada electrón es esféricamente simétrica y
la parte angular de las funciones ondulatorias de un solo electrón se pueden seguir
expresando de acuerdo con los armónicos esféricos (4.15-17). No obstante, la por-
ción radial de estas funciones de onda es más compleja que en el caso del átomo de
hidrógeno. Debido a que las funciones de onda de un solo electrón pueden dividirse
en sus partes radiales y angulares, cada electrón se puede considerar como repre-
sentado por tres números cuánticos n, m y l, al igual que en el 1-tidrógeno. Sin
embargo, puesto que la función radial de onda no tiene ya la forma (4.15-19),
correspondiente a un simple potencial de Coulomb, los estados que tienen el mismo
valor de n, pero un valor diferente de l, ya no están degenerados y la energía total
del electrón depende del número cuán tic o orbital l así como de n.
En vista de estas observaciones, los niveles de energía de átomos complejos se
pueden calcular y ya se pueden hacer predicciones acerca de los espectros de dichos

16 Para obtener un estudio completo de este tema véase, por ejemplo, C. W. Sherwin, op.
cit., capítulos 7-10 o bien, E. Merzbacher, op. cit., capítulos 16-20.
142 Mecánica cuántica. Generalidades

átomos. No obstante, estas predicciones no concuerdan por completo con la expe-


riencia, a menos que se efectúen dos correccciones adicionales.
La primera de éstas es la hipótesis del espín electrónico, que fue introducida
por Goudsmit y Uhlenbeck en 1925, según la cual, cada electrón, además de la
cantidad de movimiento angular orbital que tenga, debe poseer una cantidad de
movimiento angular intrínseco o cantidad de movimiento angular de espín, de mag-
nitud L 8 = -!-h..J3, cuya componente a lo largo de cualquier eje de campo dado
puede tener dos valores posibles hm8 = ± h/2. En consecuencia, el electrón puede
existir en dos "estados de espín" correspondientes a dos valores posibles de m8 •
Estos dos estados de espín se mencionan con frecuencia como estados de "espín
ascendente" y "espín descendente". Se puede considerar que el electrón tienen un
número cuántico de cantidad de movimiento angular total del espín s, que sólo
puede tener un valor de 1/2, en cuyo caso, análogamente a lo que establece
(4.15-40), la cantidad de movimiento angular del espín es

(L.) = nJ s(s + 1) = nJ3¡2, (4.16-1)

y un número cuántico m8 que representa la componente z de la cantidad de movi-


miento angular del espín que puede tener los valores ± 1/2, análogamente a
(4.15-43), la componente z de dicha cantidad de movimiento es

(L•• ) = m.ñ = ± ñ/2. (4.16-2)

Así pues, la degeneración de todos los estados electrónicos que se producen


en el hidrógeno y en átomos más complejos, se duplica debido a que haya dos
estados del espín del electrón. La cantidad de movimiento angular intrínseca del
electrón es una consecuencia de la relatividad y se obtuvo de los primeros principios
cuando se formuló la ecuación de onda del modo covariante relativísticamente, como
lo demostró Dirac en 1928. La incorporación del espín electrónico al formalismo de
la mecánica ondulatoria en realidad no constituye ninguna suposición nueva en esta
rama de la física.
El otro factor que se debe introducir en la explicación del comportamiento de
sistemas de muchas partículas, de acuerdo con la mecánica ondulatoria, es el prin-
cipio de exclusión de Pauli, que establece que en un sistema dado (que puede ser un
átomo, una molécula o todo un cristal compuesto de muchos átomos interactuantes),
no hay dos electrones que puedan ocupar el mismo estado cuántico, considerándose
los estados de espín opuestos como si fueran estados diferentes. Aplicándolo a un
átomo complejo, el principio significa que no puede haber dos electrones en el
átomo que posean los mismos números cuánticos, n, l, m y m8 • Para otros sistemas,
esto significa que no puede haber más de g electrones que ocupen un nivel energé-
tico que se haya degenerado g veces. Aunque los electrones obedecen al principio de
Pauli, hay otras partículas tales como los fotones, que no lo hacen. En general, las partí-
culas tales como los electrones cuyo espín es múltiplo de (s = f, f, f, • • • ) obedecen
al principio de Pauli, en tanto que otros, como los fotones cuyo espín intrínseco es
entero (s =O, 1, 2 • • • ), no lo obedecen. Este hecho origina diferencias muy impor-
tantes en el comportamiento estadístico de los grupos de electrones y fotones, lo cual
se verá en el siguiente capítulo.
La adición del espín electrónico y ta principio de Pauli al planteamiento de la
mecánica ondulatoria de átomos de muchos electrones, ayudó a explicar el sistema
periódico de los elementos basándose en la ocupación sucesiva de los estados electró-
nicos de los átomos. Este enfoque se ilustra en la tabla 4.2, en donde se indica la
configuración electrónica de cada átomo.
El espín electrónico 143

TABLA 4.2.
Configuraciones electrónicas y el sistema periódico

1s H ls
He 1s 2 )
2s Li 1s 2 )2s
Be 1s 2 )2s 2
B 1s 2 )2s 2 2p
e 1s,)2s,2p>
N 1s 2 )2s 2 2p 3
o 1s,)2s,2p4
F 1s2 )2s 2 2p 5
Ne 1s2 )2s 2 2p 6)

3s Na 1s 2 )2s 2 2p 6)3s
Mg 1s 2 )2s 2 2p 6)3s 2
3p Al 1s2)2s 2 2p 6)3s 23p
Si 1s2)2s22p6)Js2Jp2
p 1s2)2s22p6)Js2Jp3
S 1s2)2s22p6)Js2Jp4
Cl 1s2)2s22p 6)3s2 3ps
A 1s2)2s22p6)Js2Jp6)

4s K 1s 2 )2s 22p 6)3s 23p 6)4s


Ca 1s 2)2s 22p 6 )3s 23p 6 )4s 2
3d Se 1s 2)2s 22p 6 )3s 23p 6 3d)4s 2
Ti 1s 2 )2s 2 2p 6 )3s 2 3p 6~d 2 )4s 2
V 1s2)2s22p6)Js2Jp6Jd3)4s2
Cr 1s2)2s22p6)Js2Jp63ds)4s
Mn 1s2)2s22p6)Js2Jp63ds)4s2
Fe ls 2)2s 22p 6)3s 23p 63d6)4s 2
Co 1s 2)2s 22p 6)3s 23p 63d 7 )4s 2
Ni 1s2)2s22p6)Js2Jp6JdB)4s2
Cu ls2)2s22p6)Js>Jp6Jdlo)4s
Zn 1s2)2s22p6)Js2Jp6Jdlo)4s2
4p Ga ls 2)2s 22p 6)3s 23p 63d 10)4s 24p
Ge 1s2)2s22p6)Js2Jp6Jdlo)4s24p2
As ls2)2s22p6)Js2Jp6Jdlo)4s24pJ
Se ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 4
Br ls2)2s,2p6)Js2Jp6Jdlo)4s24ps
Kr ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 6) ... etc.

Según la representación de esta tabla, el átomo más simple, H, tiene un solo


electrón, que en la configuración de energía más baja del sistema, debe encontrarse
en un estado ls. El siguiente átomo, He, con dos electrones, puede tener dos
electrones ls con espins opuestos en la configuración de energía más baja (o estado
fundamental o basal). Esta configuración se denota con ls 2 Puesto que sólo hay
dos estados relacionados con el nivel n = 1, 1 = O, el siguiente átomo más complejo,
144 Mecánica cuántica. Generalidades

Li, debe tener, de acuerdo con el principio de Pauli, la configuración de estado basal
ls 2 )2s, con lo cual se indica que el tercer electrón pasa al siguiente estado energé-
tico más bajo, o sea, 2s. El cuarto elemento, Be, tiene dos electrones 2s más; pero
puesto que sólo existen dos estados 2s, el principio de Pauli requiere que el quinto
elemento, B, tenga un electrón en el nivel 2p, que es el más bajo en energía,
excepción hecha de ls y 2s; así pues, B tiene la configuración de estado basal
ls 2 )2s 2 2p. Existen seis estados 2p posibles que corresponden a los números cuán-
ticos n = 2, l = 1, m = O ± 1 y m 9 = ± 1/2. Los cinco elementos siguientes, C, N, O, F y
Ne tienen un electrón 2p adicional para llenar el nivel 2p. La capa 2p llena es esférica-
mente simétrica y muy estable, como sucede en la capa ls llena, y los elementos Ne y
He, que tienen estas configuraciones, son gases inertes. Los elementos subsecuentes lle-
nan, entonces, las capas 3s y 3p, como se indica en la tabla, y terminan con otro gas
inerte, A, que tiene una capa 3p llena con 6 electrones. Los elementos que tienen arre-
glos similares de los electrones externos o de valencia en los grupos n = 2 y n = 3,
poseen propiedades químicas similares.
Cuando se llena el nivel 3p, los dos elementos siguientes agregan electrones en
los estados 4s y no en los niveles 3d, como podría esperarse. Esto se debe simple-
mente, a que el estado 4s tiene una energía más baja que el estado 3d. Luego viene
una serie de 8 ''elementos de transición" que tienen una capa interna 3d incompleta.
Cuando este nivel 3d se llena por fin, se sigue llenando la capa 4p concluyendo con
otro gas inerte, Kr. El resto de la tabla se puede elaborar siguiendo, por lo general
los mismos lineamientos. En todos los casos, la estructura de la capa externa de
elementos químicamente relacionados, tales como Li, Na, K, Rb, y Cs es idéntica.
Por tanto, es evidente que la teoría cuántica explica satisfactoriamente no sólo la
estructura de los niveles energéticos observados espectroscópicamente, en el caso de
los átomos complejos, sino que también explica la disposición de los átomos en el
sistema periódico y la regularidad con que se distribuyen en dicha tabla las propie-
dades químicas de los elementos.

EJERCICIOS
l. Demuestre que el valor esperado de la energía es igual a la constante de separación é,
para un sistema que tiene funciones de onda dependientes del tiempo, de la forma (4.8-8).
Demuestre que el valor esperado del operador hamlltoniano, tomado sobre la función de onda
independiente del tiempo es igual a é para este tipo de sistema.
2. Demuestre que si z 1 y z 2 son dos números complejos cualesquiera, entonces (z 1 z 2 )* =
zjz~; demuestre que el conjugado complejo de una cantidad compleja expresado en forma polar
feifJ (f. 8 real) es {*e-ifJ.
3. Para la partícula libre de la sección 4.9, la velocidad de fase, de acuerdo con (4.9-5) es
w/k =f'k/2m =p/2m. Sin embargo, desde el punto de vista clásico, la velocidad de una partícula
libre es p/m. Explique por qué discrepan en un factor de 2.
4. Verifique directamente que la función de onda (4.9-11) correspondiente a una partícula
libre, satisface la ecuación de Schrodinger (4.7-3) cuando V= O.
5. Verifique la ecuación (4.9-18) expresando la función (4.9-17) como un integral de
Fourier con la ayuda de (4.9-16).
6. Encuentre (x)n, {px)n, {pi>n para el nésimo estado propio del pozo de potencial infinita-
mente profundo de la sección 4.10, y demue~tre explícitamente que En= {p~)n/2m, para las
partícula libre.
7. ¿Cuál es la razón de las amplitudes que tienen las funciones propias del continuo del
pozo de potencial finito de la sección 4.11, en la región (-a <x <a), a la amplitud que hay en
las regiones (x <-a, x >a)?
8. De acuerdo con la definición (4.12-29), demuestre 4ue dHn(~/d~ = 2nHn-i (~). Nota:
observe que dn(xf(x))/dxn =X dnffdxn + ndn-i {/dxn-i.
9. A partir de (4.12-29), corrobore que Hn+i(~=2~n(~)- 2nHn_¡(~).
10. De acuerdo con los re~ultados de los problemas 8 y 9, demuestre que las funciones
Hn(~) satisfacen la ecuación de Hermite (4.12-16).
El espín electrónico 145

11. Encuentre el valor esperado de la energía potencial <v>n para el nésimo estado propio
de un oscilador armónico cuántico unidimensional: Nota: use las propiedades de ortogonalidad
de las funciones de onda.
12. Determine el valor esperado de la energía cinética <K>n correspondiente al nésimo
estado propio de un oscilador armónico cuántico unidimensional y utilice el resultado del pro-
blema 11 para demostrar que (V)n +<K>n = hvo<n +-!), lo cual concuerda con lo que se puede
mtuir.
13. Mediante la evaluación de la desviación estándar, demuestre que la cantidad de movi-
::~iento de una partícula libre es una constante del movimiento.
14. En relación con los estados propios del átomo de hidrógeno, demuestre que la probabi-
.Jdad de encontrar al electrón dentro de una capa esférica de espesor dr y radio r es r2R~ 1 (r).
Suponga que los armónicos esféricos Y¡m(O, cp) están normalizados.
15. Demuestre directamente que la fórmula de la desviación estándar indica a= O para los
vperadores L2 y Lz para el átomo de hidrógeno.
16. Obtenga las expresiones (4.15-36) para L2, a partir de las expresiones (4.15·35) para
Lx,Ly y Lz.
17. Utilice los métodos de la sección 4.15 y demuestre que si (€") se puede evaluar como
·JI'") usando las ecuaciones de onda independientes del tiempo, entonces, (en+t) se puede
:epresentar como (Jt'•+t) usando estas mismas funciones. Indique en forma inductiva la manera
<!n que esto significa que {f(e)) se puede obtener a partir de (/(Jt')) empleando las funciones de
·Jnda independientes del tiempo, en donde /(€) es una función de € que se puede representar
.:omo una serie de potencias convergente.

LECTURAS RECOMENDADAS
D. Bohm, Quantum Mechanics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1951).
E. Ikenberry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Press,
Nueva York (1962).
R. B. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., lnc., Nueva York (1959).
E. Merzbacher, Quantum Mechanics, John Wiley & Sons, Inc., Nueva York (1961).
L. Pauling y E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill Book Co., lnc.,
Nueva York (1935).
J. L. Powell y B. Craseman, Quantum Mechanics, Addison-Wesley Publishing Company, Inc., Rea-
ding, Mass. (1961).
C. W. Sherwm, lntroduction to Quantum Mechanics, Holt, Rinehart and Winston, Inc., Nueva
York (1959).
J. C. Slater, Quantum Theory of Matter, McGraw-Hill Book Co., Inc., Nueva York (1951).
CAPITULO 5
Mecánica estadística.
Generalidades

5.1 INTRODUCCION

El objetivo de la mecamca estadística es analizar el comportamiento de un


gran conjunto de partículas o sistemas idénticos, en una forma estadística o proba-
bilística, derivando los valores más probables de las propiedades del conjunto sin
inquirir en detalle los valores de estas propiedades para una partícula dada en un
momento determinado.
Este estudio se limitará a un conjunto de sistemas idénticos que se supondrán
independientes unos de otros, excepto que pueden actuar entre sí o con el medio
ambiente externo, sólo a través de procesos instantáneos que conservan la energía y
la cantidad de movimiento. Por ejemplo, estos sistemas podrían ser las partículas de
un gas monoatómico ideal de partículas libres que pueden interactuar unas con otras
o con el medio circundante, interviniendo en colisiones instantáneas, o bien podrían
representar sistemas de otros tipos. Los campos de fuerza externos (eléctrico, magné-
tico o gravitacional, etc.,) también pueden ejercer su influencia en estos sistemas. En
tales circunstancias, se puede tratar a ::ada sistema de un modo independiente de los
demás, y se puede describir el comportamiento de cualquier sistema de acuerdo con
sus coordenadas en un espacio de fase sesquidimensional cuyas coordenadas son
(x, y, z, Px, Py. Pz). Se supone que estas coordenadas son independientes y ortogo-
nales, y la especificación completa del estado de movimiento de cualquier partícula
perteneciente al conjunto se expresa asignando valores a estas seis coordenadas espa-
ciales; entonces, su comportamiento subsecuente se puede describir, en principio,
basándose en estos conocimientos.
El postulado básico de la mecánica estadística es que la probabilidad a priori
de que un sistema esté en cualquier estado cuántico dado, es la misma para todos
los estados cuánticos del sistema. Esto significa, por ejemplo, que la probabilidad a
priori de que una partícula libre se encuentre dentro de una región (Ax, Áy, &)
alrededor de (x, y, z) es la misma para todos los valores de x, y, z, y la probabi-
lidad de que su cantidad de movimiento esté comprendida dentro de una región
(¡jpx, ¡jpy, ¡jpz) alrededor de (px,Py.Pz) es idéntica para todos los valores de
(px, Py, Pz). Se debe subrayar el hecho de que este postulado se refiere sólo a las
probabilidades a priori, es decir, a las probabilidades que prevalecen en ausencia de
cualquier restricción dinámica. Las probabilidades a priori en cualquier conjunto de
sistemas se modifica casi siempre mediante restricciones externas impuestas al sis-
tema, tales como requisitos de que el número total y la energía total de todos los
sistemas que pertenecen al conjunto se mantengan constantes.

147
148 Mecánico estadística. Generalidades

Primero se tratarán las partículas pertenecientes al conjunto, como si fueran las


clásicas "bolas de billar," considerando que se pueden distinguir unas de otras y
suprimiendo que un número cualquiera de ellas puede encontrarse en un solo estado
cuántico. Después de esto se investigará el efecto que tiene el principio de exclusión
de Pauli y cuál es el efecto de la imposibilidad de identificación de las partículas
elementales que se están estudiando. Se recurrirá con mucha frecuencia a los resul-
tados del capítulo anterior e, incluso, en el caso del planteamiento estadístico de las
partículas clásicas, se utilizará el marco cuántico de los niveles energéticos y los
estados cuánticos, aunque no sea absolutamente necesario hacerlo, con el fin de
conservar la misma consistencia y uniformidad.

5.2 LA FUNCION DE DISTRIBUCION Y LA DENSIDAD


DE LOS ESTADOS

Para calcular las propiedades promedio de un conjunto de partículas, por lo


general se necesita conocer la forma en que dichas partículas están distribuidas, en
promedio, en lo que respecta a la energía. Si el número promedio de partículas del
sistema que ocupa un solo estado cuántico de energía e se designa como f(e) y si se
hace que g(e)de sea el número de estados cuánticos del sistema, cuya energía está
dentro de un rango de alrededor de e, entonces, el número de partículas del sistema
cuya energía está dentro del rango de alrededor de e está dado por N(e)de, en
donde

N( e) de = f(e)g(e) de. (5.2-1)

La cantidad f(e), como se definió antes, se denomina función de distribución


del sistema, y depende de las probabilidades relacionadas con la distribución de las
partículas del sistema entre los estados cuánticos disponibles. La cantidad g(e), que
depende sólo de la forma en que los estados cuánticos mismos están situados en lo
que respecta a la energía, se llama densidad de los estados.
Si se conocen estas dos cantidades, el valor promedio de cualquier cantidad a
que se puede expresar como una función de la energía total e, se puede evaluar
como

frx(e)N(a) de
<!X> =
f
"---:o----

N(e) de

= ~f rx(e)f(e)g(e) de, (5.2-2)

la integral de N(e)de tomada sobre todos los valores posibles de e da simplemente


N, que es el número total de partículas del sistema. Si la cantidad a es una función
de las coordenadas del sistema q¡( = x,y,z, para i = 1, 2, 3, respectivamente) y las
cantidades de movimiento p¡( = Px• Py. Pz, en la misma forma) que no se puede expre-
sar como una función exclusiva de la energía total e, entonces e se puede expresar como
La función de distribución y la densidad de los estados 149

una función de las coordenadas y las cantidades de movimiento, como la suma de las
energías cinética y potencial,

¡¡ =
1 "L. p¡,
-2 + V(q¡), (5.2-3)

y el valor promedio de ex evaluado como una integral sobre las coordenadas del
espacio de fase como

JI a.(p¡.q¡}f(p¡,q¡) dp dq
(a.)= . (5.2-4)
JJJ(p¡,q¡} dp dq

En este caso, f(p¡, q¡) representa la función de distribución .f(E) en donde E se


expresa en función de p¡ y q¡ por m~dio de (5.2-3), y las cantidades dp y dq
representan los elementos de volumen en el espacio de cantidades de movimiento y
en el espacio de coordenadas expresadas en cualquier forma (cartesianas, cilíndricas,
esféricas, etc.) que pueda ser conveniente para la integración. La ecuación (5.2-4) no
contiene ningún factor de densidad de estados g{p¡, q¡) debido a que, como se verá
en breve, en sistemas del tipo que se está estudiando, la densidad de los estados
cuánticos en el espacio de fase es constante y se cancelan en el numerador y el
denominador de (5.2-4). Las expresiones (5.2-2) o (5.2-4) se mencionarán con fre-
cuencia cuando se calculen los promedios.
Puesto que el factor de densidad de estados g( E), según se define en relación
con (5.2-1), depende sólo de la dtstribución de los estados cuánticos del sistema en
cuanto a la energía, debe existir la posibilidad de calcular g{E) a partir de la solu-
ción de la ecuación de Schrodinger. Esto se puede hacer en relación con las partícu-
las libres tal y como se definieron en la sección 5.1, suponiendo que el sistema está
confinado en el interior de un recipiente rígido cuyas dimensiones son x 0 ,y 0 ,z 0 en
las direcciones x-, y- y z-, respectivamente. En efecto, este recipiente es un pozo de
potencial infinitamente profundo para las partículas que se encuentran en su interior,
siendo el potencial igual a cero para cada partícula que se encuentra dentro del
recipiente, a condición de que las interacciones de las partículas estén restringidas a
colisiones instantáneas. En este caso, dentro del recipiente, la ecuación de Schro-
dinger se puede escribir de acuerdo con ( 4.8-5) como sigue

(5.2-5)

en donde

(5.2-6)

De acuerdo con los resultados dados en las secciones 4.10 y 4.11, se puede
llegar a la conclusión de que 1/1 =O, fuera del recipiente. De acuerdo con (4.9-3), se
puede esperar que una solución válida para (5.2-5) sería una onda plana de la forma

(5.2-7)

Se puede verificar con facilidad que, en efecto, esta solución satisface lo esta-
blecido en (5.2-5). En realidad, la ecuación (5.2-7) se puede obtener como una
solución de (5.2-5) mediante la técnica de separación de variables que se usó con el
lSO Mecánict1 estadística. Generalidades

átomo de hidrógeno, suponiendo inicialmente una solución de producto de la forma


t/1 = X(x) Y(y) Z(z). Sin embargo, para que (5.2-7) sea una solución de (5.2-5), las
cantidades kx, ky y kz de (5.2-7) se deben relacionar en tal forma que

(5.2-8)

y, en este caso, se puede considerar que estas cantidades se comportan como las
componentes de un vector k que se conoce como vector de propagación. Si se
estudia el carácter físico de la función de onda dependiente del tiempo que se
relaciona con (5.2-7) por medio de (4.8-7),

'P(x,y,z,t) = Aei(k·r-wr)
(5.2-9)
(w = efh),

debe ser evidente que la dirección de k es la misma que aquella en la que avanza el
frente de la onda. La explicación física real de esto quedará asignada como tarea
para el lector. Utilizando los métodos desarrollados en el último capítulo, se puede
demostrar que el valor esperado de la cantidad de movimiento vectorial p está dado
por

(p) = hk, (5.2-10)

y que p (y, por tanto, k) es una constante del movimiento.


Para las condiciones de frontera, se requerirá que la función de onda en cual-
quiera de las caras del recipiente sea igual a la de la cara opuesta. Estas condiciones
de frontera periódicas o cíclicas se vieron con anterioridad en relación con las vibra-
ciones de red (sección 3.3). En una geometría unidimensional, estas condiciones de
frontera representan un sistema que equivale topológicamente a un anillo. En tres
dimensiones, las condiciones periódicas de frontera dividen todo el espacio en regio-
nes exactamente similares cuyas dimensiones son (x 0 , y 0 , z 0 ), siendo la función de
onda la misma en cada una de ellas, y cualquiera de estas regiones se puede usar
para representar el interior del pozo de potencial correspondiente al recipiente. Pro-
cediendo de esta manera y suponiendo que los bordes del recipiente se extienden a
lo largo del eje x desde O hasta Xo, a lo largo de la dirección y, de O a y 0 y en la
dirección z, de O a z 0 , las condiciones de frontera se convierten en

tf¡(O,y,-z) = tf¡(x 0 ,y,z)

t/l(x,O,z) = tf¡(x,y 0 ,z) (5.2-11)

tf¡(x,y,O) = tf¡(x,y,z 0 ),
lo cual requiere que en (5.2-7) se tome

(nx = 0,± 1,±2, ···)

(ny = 0,± 1,±2, ···) (5.2-12)

(nz = 0,± 1,±2. ··· ),


La función de distribución y la densidad de los estados 151

y luego, (5.2-7) se reduce a


lni(nxx + nll'y + ~)
1/l(x,y,z) = Ae xo Jlo zo • (5.2-13)

De acuerdo con (5.2-2) y (5.2-6), esto significa que sólo es permisible un


grupo discreto de valores de energía dados por

(5.2-14)

De acuerdo con (5.2-10), los valores permisibles de (kx, ky, kz) se pueden expresar
como los valores permisibles de (px,Py,Pz) en la forma

Py = hny/Yo (5.2-15)

Si se graficaran todos los valores permisibles de la cantidad de movimiento,


haciéndolos corresponder a todos los valores enteros posibles de (nx, ny, nz) en
(5.2-15), como puntos en un espacio ortogonal de cantidad de movimiento cuyas
coordenadas son (px, Py, Pz ), se obtendría una red ortogonal simple de los puntos,•
que representan los valores permisibles de la cantidad de movimiento, en donde las
dimensiones de la célula unitaria (h/x 0 , h/y 0 , h/z 0 ) corresponden a los cambios unita-
rios en (nx, ny, nz) en (5.2-15). El volumen del espacio de cantidad de movimiento
correspondiente a un solo estado cuántico del sistema es, simplemente, el volumen
de la celda unitaria

(5.2-16)

en donde V es el volumen físico del recipiente. De acuerdo con esto (y con la


gráfica de los puntos que representan las cantidades de movimiento permisibles), se
observa que la densidad con la que están distribuidos los estados cuánticos permisi-
bles en el espacio de cantidad de movimiento, es uniforme sobre todo el espacio,
[lo cual se mencionó anteriormente en relación con las ecuaciones (5.7-4)]. En
(5.2-16), no se tomó en cuenta el espín; para partículas con espín de l/2, como los
electrones, existen dos estados permisibles de cantidad de movimiento por cada pun-
to reticular dentro del espacio de cantidad de movimiento correspondientes a las dos
orientaciones posibles de espín de la partícula. Si se toma esto t'n cuenta, (5.2-16)
debe escribirse en la forma

(5.2-17)

Para valores grandes de x 0 ,y 0 y z 0 , tales como los que se relacionan con un


recipiente de dimensiones macroscópicas, el volumen VP de (5.2-17) se hace muy
pequeño y los estados de cantidad de movimiento (5.2-15) y los estados de energía
(5.2-14) se concentran excesivamente en comparación con los intervalos de energía y
cantidad de movimiento que se pueden apreciar macroscópicamente. Entonces, para
un sistema de dimensiones razonables, estará justificado el considerar que los valores
permisibles de energía y cantidad de movimiento están distribuidos t'n una forma
substancialmente continua dentro del espacio de cantidad de movimiento.
152 Mecánica estadística. Generalidades

Ahora se verá una superficie dentro del espacio de cantidad de movimiento


(px, p , Pz), estando todos estos puntos a una energía constante e. De acuerdo con
(5.2-6), (5.2-8)__rj_5.2-10), la ecuación de esta superficie debe ser la de una esfera
de radio p = ..j2me, o bien,

P2 = Px2 + Py2 + Pz2 = 2me. (5.2-18)

Esta superficie aparece ilustrada en la figura 5.1. En esta misma figura se


muestra una esfera similar cuya superficie representa todos los puntos de energía e + de.
La capa esférica entre estas dos esferas representa la región del espacio de cantidad de
movimiento correspondiente a las energías comprendidas en el rango de e a e +de. El
volumen del espacio de cantidad de movimiento contenido dentro de. esta capa es

dVP = 4n:p 2 dp. (5.2-19)

Sin embargo, de acuerdo con (5.2-18),

p dp =m de, (5.2-20)

por lo cual,

dVP = 4n:p ·m de= 4n:mjlme de. (5.2-21)

El número de estados cuánticos que se pueden encontrar en este volumen del


espacio de cantidad de movimiento se determina dividiendo este resultado entre el
volumen de tal espacio, relacionado con un solo estado cuántico dado por (5.2-17).
Por definición, el resultado

g(e) de
8 fin:v
= "h 3
J-
m3 ' 2 e de, (5.2-22)

es el factor de densidad de estados que se menciona en (5.2-1). Por supuesto, este


resultado se refiere sólo a las partículas libres suje~as exclusivamente a interacciones
tales como choques instantáneos. Para otros sistemas, sobre todo aquellos en los que

Cantidad de
movimiento p,
energía •
Cantidad de
movimiento p + dp,
energía • + d•

P,

Figura 5.1. Superficit>s esféricas correspondientes a energías constantes e y e +de graficadas en


el c<pacio de cantidad de movimiento (px, Py, Pz) de una partícula.
La distribución Maxwe/1-Boltzmann 153

se produ..~.: L'!n3C..-iooes mutuas de largo alcance entre partículas, el factor de


densidad de esudos sería mucho más complejo. Así también, el resultado (5.2-22)
pertenece estrictamente hablando sólo a un recipiente de la forma de un sólido
rectangular. No obstante, puesto que sólo en el resultado fmal aparece el volumen
d~l recipiente, por simple intuición se deduce que se obtendría la misma densidad de
ntados para un recipiente de volumen semejante, independientemente de su forma.
Se puede demostrar que esto es verdad.

5.3 LA DISTRIBUCION MAXWELL-BOLTZMANN

Si no existen restricciones respecto a los valores de energía y cantidad de


movimiento que una partícula del sistema pueda poseer, la probabilidad asociada con
todos los estados cuánticos es la misma y el promedio del número de partículas por
estado cuántico será independiente de la energía. Esto significa que la función de
distribución fte) será constante. Esta simple situación no es muy importante desde el
punto de vista físico, ya que un sistema que está térmicamente aislado del medio
que lo rodea debe obedecer la restricción de que la suma de las energías de todas
las partículas del sistema debe ser constante, y éste es precisamente el tipo de
sistema que se estudiará aquí. En este caso que es más apegado a la realidad se
reduce la proporción de partículas que ocupan estados de energía sumamente altos,
y la función de distribución ya no es constante con respecto a la energía.
Para determinar cuál es la función de distribución en estas condiciones, será
necesario proceder en primer lugar de acuerdo con los lineamientos clásicos, imagi·
nando que las partículas del sistema son objetos identificables tales como las bolas
de billar numeradas. Todo esto se hará dentro del marco de los estados cuánticos y
los niveles de energía, aunque, haciendo caso omiso del principio de exclusión de
Pauli, se permitirá que un número de partículas ocupe un estado cuántico dado del
s1stema. Se supondrá que se trata de un sistema aislado de N partículas distinguibles,
.:on una energía total constante U que se puede distribuir entre n niveles de energía
e1 , e2 , e2 , • • • e¡, • • • En. Desde el punto de vista estadístico, el conjunto tendrá la
distribución de energía que corresponde a una distribución aleatoria de partículas
entre los niveles, y en donde el número de cada nivel está dado por
.V 1 ,N2 ,N3 , · ··N¡,···Nn. De todas las distribuciones fortuitas de N partículas
~ntre n niveles energéticos, algunas ocurrirán con una probabilidad relativamente alta
desde un punto de vista puramente estadístico, y otras serán muy poco probables.
Esta situación es análoga al hecho de lanzar simultáneamente dos monedas en las
que la distribución (1 águila, 1 sol) es más probable que la distribución (2 águila, O
sol) o bien, (O águila, 2 sol). La distribución que tiene la máxima probabilidad de
ocurrir es la distribución de partículas entre niveles que se pueden producir dentro
de un número máximo de formas estadísticamente independientes. En consecuencia,
se supondrá que el estado de equilibrio del sistema corresponde íntimamente a esta
distribución estadística de partículas entre niveles que tienen la máxima probabilidad
en las condiciones del problema.
El cálculo del número de maneras en que las partículas identificables se pue-
den distribuir entre los niveles energéticos de un sistema, equivale a la determinación
del número de formas en que una cantidad de objetos numerados se puede distribuir
entre un conjunto de recipientes también numerados. Así pues, es necesario estudiar
el problema de determinar la cantidad de formas para distribuir N objetos identifi-
cables entre n recipientes, de tal manera que haya N 1 en el primero, N 2 en el
segundo, • • • , N¡ en el iésimo, etc. Este número será proporcional a la probabilidad
154 Mecánica estadística. Generalidades

con la que pueda ocurrir una distribución en donde N 1 , N 2 , • • • , Nn objetos se


encuentran dentro de los recipientes 1, 2, 3, • • • , n.
En primer lugar, se supondrá que se cuenta sólo con dos recipientes en los que
se pueden colocar los objetos, como se ilustra en la figura 5.2. En general, se tendrán
N 1 objetos dentro del recipiente 1 y N 2 en el recipiente 2, con

N1 + N2 = N = const. (5.3-1)

Sea Q(N 1 , N 2 ) el número de formas estadísticamente independientes de llegar a


la distribución (N 1 ,N2 ) de objetos en los recipientes (1, 2). Ahora, Q(O,N2 ) es
evidentemente igual a 1, porque la única forma de lograr esta distribución es poner
todos los N objetos dentro de la segunda caja, como se indica en la figura. De igual
manera, Q(l, N 2 ) =N, ya que para alcanzar esta distribución se puede poner el
objeto 1 dentro del primer recipiente y el resto en el segundo, el objeto 2 dentro
del primer recipiente y el resto en el segundo, y así sucesivamente hasta N objetos.
Existen N formas de seleccionar un objeto para colocarlo dentro del primer reci-
piente y, por tanto, N maneras de llegar a la distribución deseada. Si se tienen dos
objetos dentro de la primera caja, entonces Q(2,N2 ) =N(N- 1)/2! . Este resultado
se obtiene debido a que hay N formas de escoger el primer objeto que va al primer
recipiente; pero sólo N- 1 maneras de escoger el segundo de los objetos restantes.
Así también, las dos distribuciones en las que el objeto numerado a se escogió como
el primero y el objeto numerado {J como el segundo para colocarlo dentro del
primer recipiente, y en donde {J se escogió como el primero y a como el segundo,
son en realidad idénticos, y los mismos dos objetos acaban por colocarse dentro de
la primera caja; por tanto, el factor N(N- 1) se debe dividir entre dos. Para el caso
en que se tienen tres objetos dentro de la primera caja, existen N formas de escoger
el primero, N- 1 formas de escoger el segundo y N - 2 maneras de escoger el

Nz (j) ® ®---0---®
Compartimiento Núm. 2 Partículas

Q(O,N2 ) = 1

Q(I,N2 )=N

N formas de escoger a
Q( 2 N)=N(N-I)
N-1 formas de escoger (3
' 2 21 (pero las dos distril:iuciones
que aparecen a la izquierda
son la misma)

N formas de escoger a
N-1 formas de escoger p
N-2 formas de escoger 'Y
(pero las 3! distril:iuciones
ilustradas son la misma)

Figura 5.2. Jo'ormas posibles de distribuir N partículas identificables entre dos recipientes.
La distribución Maxwell-Boltzmann 1SS

tercero, en tanto que hay 3! formas de permutar entre sí los objetos enumerados
a, (3, y 'Y como si se les hubiera seleccionado en primero, segundo y tercer lugares,
por lo que Q(3, N 2 ) = N(N- 2)/3! . Por supuesto, se puede confirmar con este
procedimiento, entonces, recordando (5.3-I), se puede establecer que

N(N-1)(N-2)···(N-N 1 +1) N! N!
Q(N¡,Nz) = N1! = N 1 !(N- N 1)! N 1 !N 2 !
(5.3-2)
Supóngase ahora que el segundo recipiente se divide en dos subcompartimien-
tos que contienen v 1 y v2 objetos en donde, por supuesto,

(5.3-3)
como se ilustra en la figura 5.3. El número de formas independientes que logra la
distribución (v 1 , v 2 ) entre los subcompartimientos de la segunda caja es, de acuerdo
con (5.3-3),

(5.3-4)

Sin embargo, ahora se podría considerar que el sistema tiene tres recipientes
distintos y que el número total de maneras de acomodar los objetos, requerido para
que haya N 1 en el primer recipiente, v 1 en el segundo y v2 en el tercero [que se
denominará Q(N 1 ,v 1 ,v 2 )], será sencillamente el producto de Q(N1 ,N2 ) y Q(v 1 ,v 2 ),
ya que para cada arreglo (N1 , N 2 ), habrá Q(v 1 , v 2 ) maneras de acomodar las par-

IN·
Compartimiento : 1
m
~
2

Figura 5.3. Subdivisión del segundo recipiente en dos subcompartimientos; de hecho, se puede
considerar que el sistema así obtenido se ha dividido en tres recipientes diferentes.

tículas entre los subcompartimientos y existen Q(N 1 ,N2 ) maneras básicas de llegar a
una distribución (N1 , N 2 ) para los dos recipientes originales. De donde, se encontrará
que

(5.3-5)

A continuación, el trabajo se limita a marcar de nuevo los tres recipientes


como las cajas 1, 2 y 3, y denominar a los objetos dentro de cada una N 1 , N 2 y
N3 en lugar de N 1 , V 1 y v 1 , en cuyo caso (5.3.-5) se puede expresar como sigue
N!
Q(N¡,Nz,N3) =N 1N 1N 1 (5.3-6)
1. 2. 3.
156 Mecónica estadística. Generalidades

Una vez más, se puede imaginar que el tercer compartimiento se subdivide


como antes y, utilizando el mismo procedimiento se obtiene una expresión para el
número de acomodos requeridos a fm de distribuir N objetos entre cuatro cajas en
un forma tal que se obtenga una distribución (N 1 , N 2 , N 3 , N 4 ). Mediante la aplica·
ción repetida de este procedimiento el resultado se puede extender indefinidamente
por inducción hasta abarcar el caso en que se tengan n cajas. De acuerdo con
(5.3-3) y (5.3-6), es evidente que se encontrará

(5.3-7)

en donde el símbolo TI indica un producto ampliado, en la misma forma en que el


bien conocido ¿ expresa una suma.
La probabilidad real relacionada con una distrioución dada de N objetos entre
n cajas, es el número de diferentes maneras de acomodar objetos en Q(N 1 , • • • Nn)
cajas, requerido para obtener esta distribución particular, dividido entre el número
total de maneras de acomodar N objetos en n cajas sin tener en cuenta la distribu-
ción resultante de objetos entre las cajas. Como se puede demostrar con facilidad,
este último factor es nN. La probabilidad relacionada con una distribución dada es,
entonces, Q(N 1 , • • • Nn)/nN. Sin embargo, se encontrará que es más conveniente
manejar sólo las cantidades Q(N 1 , • • • Nn), que son proporcionales a las probabili-
dades reales, ya que sólo se tiene el interés de determinar los valores de N 1 , • • • Nn
que le dan un máximo a la probabilidad y, si Q(N 1 , • • • Nn), es un máximo, tam-
bién lo es la probabilidad asociada.
Ahora se identificará el iésimo recipiente con el iésimo nivel energético del
sistema, y el número de objetos N¡ de dicho recipiente con la cantidad de partículas
pertenecientes a ese nivel. Sin embargo, se debe permitir un margen por si los
niveles energéticos degeneran y se supondrá que hay g¡ estados cuánticos indepen-
dientes asociados con el iésimo nivel energético, cada uno de los cuales tiene la
misma probabilidad a priori de estar ocupado, de acuerdo con el postulado funda-
mental de la sección 5.1. Entonces, cada nivel de energía se debe considerar no
como un solo recipiente, sino como un grupo de g¡ recipientes, según se ilustra en la
figura 5.4. Para un nivel energético dado, por ejemplo, el iésimo que contiene N¡
partículas y g¡ estados cuánticos independientes, existen gf'i formas de acomodar las par-
tículas en los estados o recipientes pertenecientes a tal nivel, porque existen g¡ opciones
independientes respecto al lugar en que se puede colocar la primera partícula y para
cada una de éstas, hay g¡ selecciones del sitio donde se puede colocar la segunda, y

Degeneración g; =4 6 2

.: r-·-'-- 1

. --- 1
--1-- le.
•• 1 • r--1- •1
~··· • _L
Nivel 1 2 n
Población N¡ 4 7 2

Figura 5.4. La subdivisión de los niveles energéticos en diferentes estados cuánticos de acuerdo
con ~u dcgenerac.:ión. Dichos estados desempeñan el mismo papel que los recipientes
del desarrollo e~tadístico, y cada uno tiene el mismo peso estadístico.
La distribución Maxwell-Boltzmann 157

así sucesivamente hasta N¡ factores. Cada uno de estos arreglos constituye una forma
estadísticamente, independiente de distribuir partículas entre los estados cuánticos
del sistema, ya que estos estados cuánticos son de igual probabilidad, y no así los
niveles energéticos. Si el primer nivel de energía e 1 , fuera el único nivel degenerado,
se tendrían i( 1 maneras independientes de establecer una distribución específica de
partículas entre los niveles energéticos, como se indica en (5.3-7), ya que existen
muchas maneras de permutar las partículas entre los distintos estados degenerados
pertenecientes al primer nivel, y por cada uno de éstos queda todavía el mismo
número de maneras de asignar las partículas a los otros niveles del sistema, de tal
modo que se obtenga la distribución (N1 , N 2 , • • • Nn). Si además el segundo nivel
estuviera degenerado, se tendrían 112 posibilidades por cada una que existió antes,
siendo ahora el número total de formas independientes en que se logra una distribu-
ción dada de las partículas entre los niveles, ¡{ 1 112
veces la que se establece en
( 5 .3-7). Es obvio que cuando se incluye la degeneración de todos los niveles, el
11
resultado (5.3-7) se deberá multiplicar por 1{ 1 21:3 • • • tf:n, lo cual da

º( N¡,N2, ... Nn ) = - n - -
N! nn g¡N,
(5.3-8)
TIN¡!i=l
i= 1

cuando se incluye la degeneración.


Ahora se supondrá que la distribución real (N 1 , N 2 , • • • N n) de partículas
entre los estados energéticos que se observa en equilibrio, es esencialmente la que se
suele obtener en el número máximo de formas estadísticamente independientes, en
otras palabras, la distribución para la que la cantidad Q de (5.3-8) es un máximo.
Entonces, Q debe maximizarse con respecto a los parámetros N 1 , N 2 , • • • Nn, te-
niendo en cuenta la~ restricciones

n
L1 N¡ = N = const.
i=
(5.3-9)

y
n
L e¡N¡ = U = const. (5.3-10)
i= 1

Esta maxnmzacwn se logra con mayor facilidad utilizando la técnica matemá·


tica denominada método de los multiplicadores de Lagrange y se hará un breve
paréntesis para describir este tema. Supóngase que se da una función f(x 1 , x 2 , • • • x n)
de n variables y hay que determinar los valores de x 1 , x 2 , • • • Xn que maximizan
f, a condición de que alguna otra constante dada <P{x 1 , x 2 , • • • xn) permanezca
constante. Para un valor máximo (o mínimo) de f, df =O y si cp permanece constante
dcp = O, de tal manera que si f es un máximo o un mínimo en estas condiciones,
entonces

df + (/. d<f> =o (5.3-11)

sea cual fuere el valor que el multiplicador arbitrario indeterminado a pueda tener.
~o obstante, (5.3-11) se puede expresar como
158 Mecánica estadística. Generalidades

De acuerdo con esta ecuación, la condición ( 5.3-11) se satisface con toda


seguridad si para cada i

a¡ o</J (5.3-13)
-+IX-=Ü {i = 1,2, ·· · n),
OX¡ OX¡

y como además se dio la información inicial de que

(5.3-14)

las ecuaciones {5.3-13) y (5.3-14), tomadas juntas, representan un grupo de n + 1


ecuaciones simultáneas que se pueden resolver para las n cantidades x 1 ,x 2 , • • • Xn
que maximizan (o minimizan) a f y [para el multiplicador indeterminado] a que se
introdujo en (5.3-11).
Si existen dos funciones auxiliares cf>(x 1 , x 2 , • • • Xn) y ¡J¡(x 1 , x 2 , • • • Xn) que
se deben mantener constantes mientras se maximiza la función f, entonces se intro-
ducen dos multiplicadores arbitrarios a y {3, y es necesario que

df + IX d</J + f3 dlj¡ =O, (5.3-15)

que lleva, en .la misma forma, a un conjunto de n + 2 ecuaciones


a¡ o<P oi/J
-+IX-+/3-=Ü (i = 1,2, ·· · n) (5.3-16)
OX¡ OX¡ OX¡

(5.3-17)

¡J¡(x 1 ,x 2 , ••• x.) = 1/1 0 = const. (5.3-18)

paras las n + 2 incógnitas x 1 , x 2 , • • • x n, a y (3.


A continuación se procederá a aplicar este método con el fin ce encontrar la
distribución N 1 , N 2 , • • • Nn para la que (5.3-8) es un máximo. Para facilitar las
operaciones matemáticas lo que en realidad se maximizará es In Q y no Q propia-
mente dicha; pero puesto que el logaritmo es una función monotónica de un solo
valor de todas las variables comprendidas, cuando In Q es un máximo, también lo es
Q. Si se toma el logaritmo de los dos lados de (5.3-8), se tiene que

n n
In Q(N 1 ,N 2 , ···N.)= In N!+ L N¡ In g¡- L In N;!.
i= 1 i= 1
(5.3-19)

Se supondrá que este sistema es tan grande que para cada nivel t:¡! se puede
aproximar, utilizando la aproximación de Stirling según la cual, para x ~ 1,

lnx!:::;;-xlnx-x. (5.3-20)

Cuando se usa esta aproximación, {5.3-19) se convierte en

In Q = In N! + L N¡ In g¡ - L N; In N¡ + L N;, (5.3-21)
i i i
La distribución Moxwell-Boltz1111lnn 159

que se debe maximizar bajo las restricciones

</J(N¡,N2, ··· Nn) = L N¡= N


¡
(5.3-22)

I/J(N¡,N2, ··· Nn) = L¡ e1N 1 =U. (5.3-23)

De acuerdo con (5.3-16), esto requiere que

o(ln Q) o</J
- - +1X-+{J-=-
oi/J a [ LN 1 lng 1 - ¿N1 lnN1 + LN1
]
iJNi oNi oNi oNi 1 1 1

(j = 1,2, ··· n).

(5.3-24)

Al desarrollar las derivadas de {5.3-24), se observa que los únicos términos de


las sumas cuyas derivadas con respecto a N¡ no sean cero son aquellos para los cuales
i = j; por tanto, ( 5.3-24)se puede reducir a

(j = 1,2, ··· n). (5.3-25)

Resolviendo para In (N¡/g¡) y desarrollando los exponenciales, esta expresión se


puede escribir en la forma

(5.3-26)

La ecuación ("5.3-26) proporciona el número promedio de partículas por estado


cuántico del sistema y, por ende, representa por definición la función de distribución
de energía f(e). Esta función de distribución particular de energía, que se obtuvo
como {5.3-26) de acuerdo con la suposición clásica de partículas identificables y sin
utilizar el principio de exclusión de Pauli, se conoce como función de distribución
de Maxwe/1-Boltzmann.
Conviene explicar la forma en que las dos constantes a y 13 se relacionan con
las propiedades físicas del sistema. En primer lugar, a la constante 13 se le asignará el
valor

p = -1/kT, (5.3-27)

en donde T es la temperatura absoluta del sistema y k es una constante denominada


constante de Boltzmann, y se considerará que esta ecuación junto con {5.3-26)
definen lo que se entiende por temperatura. A su debido tiempo se verá que esta
definición conduce a todas las bien conocidas características de temperatura que se
asocian con un gas ideal y, entonces se podrá ver claramente que, antes de definir la
temperatura, ya se podían identificar las propiedades de un gas ideal a partir de
(5.3-26). Después se podría proceder a la identificación de p con el valor dado
arriba, basándose en una comparación de los resultados así obtenidos y la ecuación
termodinámica ya conocida del estado de un gas ideal (a partir de la cual se define
más comúnmente la temperatura). Se demostrará que el valor de k se puede rela-
cionar con la constante medida del gas ideal R y el número de Avogadro.
160 Mecánica estadística.. Generalidades

Si se utiliza el valor de (J dado en (5.3-27), la expresión (5.3-26) ahora se


puede escribir como
N.J = gJ.e"e-• 1/kT. (5.3-28)

Luego, el valor de la constante a se puede expresar de acuerdo con el número


total de partículas N ya que, de acuerdo con (5.3-9) y (5.3-28),

N= L N¡= e" L g¡e-•JfkT, (5.3-29)


j j

por lo cual

e"= N (5.3-30)
L g¡e e1tkT•
j

y
Ng .e-•¡tkT
N = g .e"e-•JtkT = (5.3-31)
1 J L g¡e
J
•1¡kr

Si los niveles energéticos del sistema están muy próximos unos de otros, como
sucede con los niveles del gas de partículas libres que se vio en la sección anterior,
la cantidad g¡ de (5.3-28) se puede considerar como g(e)de y la cantidad N¡ de la
ecuación se considerará como N(e)de, de acuerdo con lo expuesto en relación con la
ecuación (5.2-1). El número de partículas dentro de un rango energético de alrede-
dor de e dentro de este límite, estará dado, de acuerdo con (5.3-28), por

N(e) de= e"e-•fkTg(e) de= f(e)g(e) de. (5.3-32)

Para un gas ideal de partículas libres, el factor de densidad de estados g(e) está
dado por (5.2-22). Obsérvese que la forma de (5.3-32) es la misma que la de
(5.2-1), siendo !(e)= e"e-efkT. Una vez más, como se vio en relación con (3.3-31),
se puede evaluar la constante a teniendo en cuenta la condición de que el número
total de partículas dentro del sistema será una constante N, por lo cual

N = f N(e) de = e" f g(e)e-•fkT de, (5.3-33)

y
N
-f
e"-~----
g(e)e-•fkT de'
(5.3-34)

en donde las integrales se toman sobre todas las energías disponibles para las par-
tículas del sistema.
Se debe observar que la cantidad Q de (5.3-8) está íntimamente relacionada
con la entropía termodinámica del sistema. En equilibrio, el estado del sistema es tal
que Q. el número de formas estadísticamente independientes de distribuir las par-
La estadístiCil de Maxwell-Boltzmann para un gas ideal 161

f(•l

7j

ura S.S. Representación esquemática de la función de distribución de energía de Maxwell-


Boltzmann para tres temperaturas distintas.

ulas entre los estados cuánticos, es un maxtmo como lo es la entropía del sis-
na Por ahora no se entrará en detalles; pero se puede demostrar 1 que la relación
stente entre estas dos cantidades es

S-= k In Q, (5.3-35)

donde S es la entropía.

LA ESTADISTICA DE MAXWELL-BOLTZMANN PARA


UN GAS IDEAL

A continuación se analizarán las propiedades de un gas ideal de partículas


es del tipo que se estudió en la sección 4.2. Para este sistema, el factor de
sidad de estado g(€) d€ está dado por (5.2-22), debido a lo cual, de acuerdo con
:-34),

"'- N (5.4-1)
e - 8j2 ¡¡; V m 3!2 f"" Jf.e-c!kT de
h3 o

La integración se toma entre los límites cero e infinito, ya que la energía de


partículas es totalmente cinética y, por ende, positiva. La integral de (5.4-l) se
de expresar en una forma más sencilla mediante la substitución

x = efkT, (5.4-2)

1 J. E. Mayer y M. Goppert-Maycr, Statistical Mechanics, John Wiley & Sons, Nueva York
!.'1), capítulo 4.
162 Mecánica estadística. Generalidades

por lo cual, (5.4-1) se convierte en

(5.4-3)

La integral se puede expresar ahora como una función r-, 2 ya que f(n) se
define como

(5.4-4)

siendo entonces la integral de (5.4-3) igual a f(3/2), que, a su vez, es igual a ..J1i72.
Si se inserta este valor en (5.4-3), se tiene que

N ( h2 )3/2 (5.4-5)
e"= 2V 2mnkT '

que permite escribir la función de la distribución de Maxwell-Boltzmann para un gas


ideal como

(5.4-6)

Nótese que el valor de e" dado por (5.4-5), es dependiente de la temperatura.


También conviene destacar quue este valor de e" pertenece sólo a la función de
densidad de estados de partículas libres (5.2-22) y que para sistemas que tienen
otras funciones de densidad de estado relacionadas con ellas, el valor de e" será
diferente del que se da en (5.4-5). En la f~ura 5.5 se muestra una gráfica de la
distribución de Boltzmann (5.4-6) para varias temperaturas. De acuerdo con (5.4-6) y
(5.2-22), es obvio que la distribución real de la densidad de partículas con respecto
a la energía está dada por

2rrN
N(e) de =f(e)g(e) de= r;,.e-•tkT de (5.4-7)
( rrk T)312 \/ .

La energía interna total y el calor específico del gas se puede obtener fácil-
mente a partir de estos resultados. Puesto que la energía de las partículas en el
rango de alrededor de e es eN( e) de, la energía interna total del gas es

U= E'"eN(e) de, (5.4-8)

o bien, utilizando (5.4-7),

(5.4-9)

2 Véa~c. pm <'Íl"mplo, I. S. y 1·~ S. Sokolnikoff, Hif{her Mathematics for Engineers and


1'/n•sicil'l.\, Md;raw-llill Hook Co., lnc., Nueva York (1941), página~. 273-276.
La estadística de Maxweii-Boltzmann para un gas ideal 163

Esta integral se puede evaluar en términos de las funciones r-, substituyendo


(5.4-2). Al desarrollar la integral de este modo, y observando que r(5/2) =
(3/2)r(3/2) = 3 .Jrr/4, se encuentra

U =tNkT, (5.4-10)

por lo cual, la energía interna promedio por partícula, U/N, es 3/2kT que es un
resultado importante y muy conocido. La capacidad calorífica del gas a volumen
constante es la razón de aumento de la energía interna con respecto a la tempera-
tura, por lo cual, de acuerdo con (5.4-10),

e (au)
Var =
V
=1Nk
,
(5.4-11)

independiente de la temperatura. El calor específico Cv es simplemente la capacidad


calorífica por unidad de volumen.
El objetivo final es derivar la ecuación de estado para un gas de Boltzmann
ideal a partir de las propiedades dinámicas de la partícula y la función de distribu-
ción. N:> obstante, antes de llegar a esto, es necesario convertir las distribuciones de
energía (5.4-6) y (5.4-7), en distribuciones de velocidad apropiadas e investigar breve-
mente cómo se pueden usar estas funciones de distribución de velocidad. En la
tabla 5.1 se proporciona el valor de algunas integrales definidas que se utilizan muy
a menudo cuando se trabaja con las distribuciones de velocidad de Boltzmann.
En un gas de partículas libres que no poseen ningún grado interno de libertad,
toda la energía se basa en la energía cinética de las partículas. Esto se puede
relacionar con la velocidad mediante la expresión

(5.4-12)

de donde

de= mv dv, (5-4.13)

y la distribución de energía ( 5.4-7), se puede escribir directamente como una distri-


bución de velocidad de la forma

N(v) dv = 47tN ( 21tkT


m )3/2v2e-mv>f2kT dv. (5.4-14)

Esta función expresa el número de partículas el sistema cuvas velocidades


quedan dentro de un rango dv alrededor de v, o el número de partículas que quedan
dentro de una capa esférica cuyo espesor es dv y el radio es v, dentro del espacio
de velocidad.
Suponga que ahora se desea conocer cuántas partículas del sistema tienen velo-
cidades tales que la componente x de la velocidad se encuentre dentro de un rango
dvx alrededor Vx, la componente y está en el rango dvy alrededor de vy y la
componente z está dentro de un rango derivada de Vz alrededor de Vz, o sea el
número de partículas que quedan dentro de un elemento rectangular de volumen
(dvxdvydvz) en el espacio de velocidad centrado alrededor del valor (vx, vy, Vz). Este
164 MecániCtJ estadístiCtJ. Generalidades

TABLA 5.1.
Integrales Maxwell-Boltzmann*

=-
4
kT
m

= ~; e~Tr2

= ~e~Tr =--
32

= 3~; e~Tr 2 256

= e~Tr =--
64

*La segunda columna de la tabla da el valor de la integral definida que aparece en la


primera columna. La tercera columna indica el valor ~ la integral definida cuando a se hace
igual a m/2kT, como casi siempre sucede cuando se trabaja con distribuciones de velocidad de
Boltzmann. La cuarta columna expresa el resultado que aparece en la tercera columna como un
múltiplo de 12 velocidad térmica media e, en donde

e= v8kT/Trm.

número se denominará N(vx, Vy, Vz)dvx dvy dvz. Ahora se procederá con más cui-
dado, principiando con (5.4-6) que, de acuerdo con (5.4-12), se puede escribir como

!( V
N (
V V)=- - - -
h2 )3/2 e-m(v 2 x+v 2 ~+v 2 ,)/2kT
(5.4-15)
'"' '' z 2V 2nmkT

Entonces, como lo requiere (5.2-1),

(5.4-16)

en donde g(vx, vy, ~·.)dvx dvy dvz es el número de estados cuánticos dentro del ele-
mento de espacio de velocidad dvxdvvdvz. De acuerdo con (5.2-17) el número de
La estadística de Maxwell-Boltzmann para un gas ideal 165

estados dentro de un elemento de volumen dpx dpy dpz del espacio de cantidad de
movimiento es (2V/h3) (dpxdPydPz), por lo cual,

(5.4-17)

Puesto que la densidad de estados en el espacio de cantidad de movimiento, es


constante, también lo es la densidad de estados en el espacio de velocidad. Si se
substituyen (5.4-15) y (5.4-17) en (5.4-16) y simplifica el resultado, se obtiene

N(v V V)
m
dv dv dv =N ( - -
)3/2 e-mlu'"+u'y+u'.)/lkT dv dv dv
x• Y' z x y z 21tkT x Y z·

(5.4-18)

Una tercera función de distribución de velocidad N(vx)dvx, que representa el


número de partículas cuya componente x de velocidad queda dentro del rango dvx
alrededor de Vx, sean cuales fueren los valores de las componentes y- y z- de
velocidad para dichas partículas, está íntimamente relacionada con la función de
distribución (5.4-18). La función de distribución N(vx)dvx se puede calcular a partir
de (5.4-18) integrando sobre todos los valores posibles de vy y Vz, siendo el resul·
tado

(5.4-19)

Los valores de las integrales definidas requeridas al integrar (5.4-18), se toma-


ron de la tabla 5.1. En la figura 5.6 se ilustra una gráfica de la distribución N(v) y
N(vx) como funciones de la coordenada de velocidad aprÓpiada.
Si se conocen estas tres funciones de distribución de velocidad, es muy fácil
evaluar los promedios sobre las distribuciones de velocidad. Por ejemplo, la velocidad

(o) ( b)

Figura 5.6. (a) Representación esquemática de la distribución de Maxwell-Boltzmann de las


velocidades de partículas, N(v) a tres temperaturas distintas. (b) La distribución
correspondiente de las componentes x de la velocidad, N(vx).
166 Mecánica estadística. Generalidodes

térmica promedio e para una partícula en una distribución de Boltzmann, se obtiene


a partir de (5.4-14) escribiendo
ra)
J, vN(v)dv 1 312 a)
(v) = o =-. 4nN (~-) f v3e-mv2f2kT dv
Soa) N(v)dv N 2nkT Jo

= J8kT/nm, (5.4-20)

en donde la integral se evaluó con la ayuda de la tabla 5.1.


Ahora ya se puede pasar al estudio de la ecuación de estado de un gas ideal.
Supóngase que las partículas chocan contra una área unitaria de la pared de un
recipiente lleno con dicho gas, como se ilustra en la figura 5.7. Si la pared es un
plano orientado en sentido normal al eje x, las componentes de la cantidad de
movimiento Py y Pz de las partículas que chocan contra la pared, se conservan, si
las colisiones de las partículas con las paredes son elásticas, lo cual se supondrá, es
el caso de que se trata. En cada colisión, la componente de velocidad Vx dirigida
hacia la pared, cambia a - Vx, alejándose de la pared. La transferencia de cantidad
de movimiento de la partícula a la pared, por colisión, es entonces 2mvx. La trans-

r----
las partículas de 1 Unidad de área
velocidades Vx dentro l
de este volumen chocarán-,-_
contra la pared durante 1
el período dt 1

1
1
1
1
L____ _
-v.dt Pared de recipiente
-x

Figura S. 7. Colisión elástica de una partícula contra la pared de un recipiente rígido, siendo Vx
la componente x de la velocidad de dicha partícula.

ferencia de cantidad de movimiento a la pared en el intervalo de tiempo dt es esta canti-


dad por el número de partículas que chocan con la pared durante este período; para par-
tículas cuya componente x de velocidad es Vx, se trata sencillamente del número de
tales partículas dentro de un volumen que se extiende a una distanciad= vxdt detrás
de la pared, o el número por unidad de volumen por vxdt, de donde, vxdt • N(vxXJvxfV.
La transferencia de cantidad de movimiento en el tiempo dt para partículas cuya velo-
cidades quedan dentro del rango dvx alrededor de Vx, entonces, es
La estadística de MaxweU-Boltzmann para un gas ideal 167

o bien,

(5.4-21)

La razón total de transferencia de cantidad de movimiento a las paredes, me-


diante las colisiones en que intervienen partículas con todos los valores posibles de
vx, se puede obtener integrando sobre vx, lo cual da, con ayuda de (5.4-19) y la
tabla 5.1,

dpx-
--
2m NJrn
--
foo V 2 e -mv2xf2kT dV--NkT
--. (5.4-22)
dt V 2nkT 0 x x V

Sin embargo, de acuerdo con la ley de Newton, el cambio en el tiempo de la


cantidad de movimiento por una unidad de área de la pared del recipiente es igual a
la fuerza ejercida sobre una unidad de área de la pared que, por definición, es la
presión P. En consecuencia, la ecuación (5.4-22) se reduce a

PV = NkT, (5.4-23)

que es la ecuación de estado para un gas de Boltzmann de partículas independientes.


La ecuación anterior tiene la misma forma que la ley del gas ideal ya cono-
cida, aunque ésta se suele escribir

PV = nRT, (5.4-24)

en donde n es el número de moles de gas en el sistema y R es una "constante


molar de gas" determinada en forma experimental, que es la misma para todos los
gases "ideales". Si el sistema tiene n moles de gas, el número de partículas estará
dado por N= nNA, en donde NA es el número de Avogadro igual a 6.026 X 10 23
moléculas por mol. En estas condiciones, (5.3-23) toma la forma

PV = nNAkT, (5.4-25)

por lo cual, comparando (5.4-24) con (5.4-25), es obvio que la constante de Boltz-
mann k debe estar dada por

(5.4-26)

de donde, la constante de Boltzmann es la constante de gas por partícula del


sistema. Su valor se puede derivar de NA y R y es igual a 1.380 x lQ-16 ergs/°K, o
bien, 8.615 x 1Q- 5 eV¡oK.
Ahora se ve con claridad que el valor de la constante {3 en la función de
distribución que se supuso en (5.3-27), se escogió correctamente. Si se hubieran
desarrollado los cálculos hasta este punto sin suponer ningún valor para {3, se habría
llegado a la ecuación (5.4-23),

PV = -N/{3, (5.4-27)
168 Mecánictl estadístictl. Generalidades

y, para que esos resultados concuerden con la ley de los gases (5.4-24) establecidos
experimentalmente, habría sido obligatorio escoger

N
-N/P = nRT =NA RT,

o bien,

(5.4-28)

.S ESTADISTICA DE FERMI-DIRAC

En el desarrollo de la función de distribución de Maxwell-Boltzmann, se con-


sidera que las partículas pueden distinguirse; pero en la práctica es imposible distin-
guir un electrón de cualquier otra partícula elemental. Es más, se admitió que un
número cualquiera de partículas ocupara el rniemo estado cuántico del sistema, a
pesar de que muchas de ellas, sobre todo los electrones, obedecen al principio de
exclusión de Pauli, que no permite que un estado cuántico acepte a más de una
partícula. Si estas condiciones adicionales se imponen al sistema, los cálculos de la
sección 5.4 se deben modificar, dando como resultado otra función de distribución
que se conoce como función de distribución de Fermi-Dirac. Esta distribución tiene
una importancia enorme, ya que describe la conducta estadística de los electrones
libres en los metales y los semiconductores; además, muchas propiedades eléctricas y
térmicas de los sólidos que no se pueden comprender en absoluto a la luz de lo
establecido con las estadísticas clásicas, se deducen como una consecuencia directa
de la estadística de Fermi-Dirac.
Si las partículas del sistema no se pueden distinguir, tampoco se pueden iden-
tificar numéricamente, como se supuso cuando se analizaron las diversas posibilidades
ilustradas en la figura 5.2. En realidad, todas las diferentes distribuciones presentadas
en cada hilera de la figura 5.2 que dan Q(N1 ,N2 ) para cualquier valor particular de
N 1 , serían iguales si se eliminaran los números que identifican las partículas, en
cuyo caso el factor (5.3-7) se reduce a la unidad. Sin embargo, en el iésimo nivel
energético se pueden permutar las N; partículas entre los g; estados cuánticos per-
tenecientes a ese nivel, y se puede hacerlo de muchas maneras cada una de las
cuales constituye una forma estadísticamente independiente de lograr un arreglo en
el que N; partículas estén en el iésimo nivel energético del sistema, como se ilustra
en la figura 5.8. El producto de los números posibles de permutaciones de partículas
entre los estados cuánticos sobre todos los niveles energéticos del sistema, da enton-
ces el número de formas independientes de efectuar una distribución dada de partí-
culas entre los niveles de energía.

~f;~:~:!Y~:el 1·1·1·11·1·11 1·1


Estado Núm. 1 2 3 4 5 s 7 9 ,.

Figura 5.8. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
de energía de un sistema en el que se aplica el principio de exclusión de Pauli.
Estadística de Fermi-Dirac 169

En el caso de Fermi-Dirac, en el que se supone que se aplica el pnncipio de


exclusión de Pauli, se permite que haya, como máximo, una partícula por estado
cuántico. En relación con la figura 5.8, que describe el iésimo nivel de energía del
sistema, existen g¡ formas de seleccionar el punto en el que !>e debe insertar la
primera partícula, g¡ - 1 formas de escoger en donde se inserta la segunda, ya que la
segunda no puede ocupar el mismo estado cuántico que la primera, g¡ - 2 formas de
escoger en donde insertar la tercera, y así sucesivamente. El número total de ma-
neras de acomodar N¡ partículas en el iésimo nivel obtenido sobre esta base, es

g.l
g1(g 1 - l)(g 1 - 2) ... (g 1 - N 1 + 1) = ( . -·~·)' (5.5-1)
g, 1.

No obstante, las partículas no se pueden distinguir entre sí y por tanto, en un


arreglo dado de partículas las N¡! formas de permutadas unas con otras y entre
estados, no se consideran como permutaciones diferentes. Fl número real de formas
independientes de lograr una distribución de N¡ partículas en el iésimo nivel, se obtie-
ne dividiendo (5.5-1) entre N¡! , lo cual da

(5.5-2)
N 1!(g1 - N 1)!

El número total de formas independientes de lograr una distribución de


(N 1 , N 2 , • • • Nn) partículas indistinguibles entre n niveles energéticos, en donde no
se tiene más de una por estado cuántico, es sólo el producto de los factores indi-
viduales de la forma (5.5-2) sobre todos los niveles, es decir,

(5.5-3)

Ahora se procederá a maxlffiJZar el logaritmo de esta cantidad con respecto a


las variables N 1 , N 2 , • • • Nn por el método de los multiplicadores lagrangeanos
utilizados en la sección 5.3. De acuerdo con (5.5-3), se tiene que

In Q1 = L In g1!- L In N1! - L ln(g1 -


i i i
N1)!, (5.5-4)

que, utilizando la aproximación de Stirling (5.3-20) se puede describir

In Q1 = L [g 1 In g1 - N 1 In N 1 - (g 1 - N 1) In(g 1 - N1)]. (5.5-5)


1

Nuevamente, se requiere que el número total de partículas del sistema y su


energía total se mantengan constantes, lo que significa que las ecuaciones (5.3-22) y
l5.3-23) deben aplicarse también en este caso, de donde, se puede escribir, al igual
que antes

(j = 1, 2, ... n), (5.5-6)


170 Mecánica estadística. Generalidades

en donde cp y 1/1 están dados por (5.3-22) y (5.3-23). Al substituir (5.5-5), (5.3-22)
y (5.3-23) en esta ecuación, se obtiene

- a~J ~ N 1 In N1 + ~ (g 1- N 1) ln(g 1 - N 1)] +oc a~i (~ N 1) + pa~i (t e N


1 1) =O.
(5.5-7)

Al desarrollar las derivadas de la sección 5.3, se encontró que

(5.5-8)

o bien, reacomodando, haciendo las exponenciales, y resolviendo para N¡/g¡ =!(e¡),

1
f(e.) = N ·fg · = 11 • (5.5-9)
1 1 1 1 + e " "1

Esta es la función de distribución de Fermi-Dirac.


Al igual que en la sección 5.4, se considerará que el valor de (3 es

p= -1/kT, (5.5-10)

y más adelante se explicará el porqué de este paso. Lo más aceptado es expresar a


como
(X= 8¡/kT, (5.5-11)

en donde e¡ es un parámetro con las dimensiones de la energía que se denomina


energía de Fermi o bien, nivel de Fermi del sistema. Por tanto, la ecuación (5.5-9)
se convierte en

N·= gi (5.5-12)
J 1 + e<•J tt)fkT '

o bien, si se supone que los niveles se juntan formando un continuo, de modo que
g¡(e¡)-+ g(e)de, entonces,

g(e)de
N(e)de = g(e)f(e) de = 1 + e<• •tlikT. (5.5-13)

Para un gas de partículas independientes tales como electrones libres, g(e)de se


representa mediante (5.2-22), al igual que un gas de Maxwell-Boltzmann.
La energía de Fermi e¡ es, en general, una función de la temperatura cuya
forma y dependencia de temperatura depende primordialmente de la densidad de la
función de estados del sistema, al igual que en el caso del parámetro correspon-
diente e" de la distribución Maxwell-Boltzmann. Su valor se determina mediante la
condición (5.3-22) o bien si se trata de un continuo de niveles, por medio de

N = const. = f g(e)de
1 + e<• •tlfkT =
f g(e)f(e)de. (5.5-14)
Estadístico de Fermi-Dirac 171

La integral se toma sobre todas las energías disponibles para las partículas del
sistema. Para un gas de Fermi de partículas independientes, g(e) está dada por
(5.2-22) y e¡ se determina mediante

N= B.j21tVm312 roo Jede


h3 Jo 1 + e<• e¡)/kT.
(5.5-15)

Desgraciadamente, esta integral no se puede evaluar en una forma analítica, de


modo que e¡ no se pueda determinar como una función simple de la temperatura.
Sin embargo, en un gas bidimensional de partículas libres, se puede demostrar, me-
diante los métodos usados para derivar (5.2-22), la función de densidad de estados es

41tmA
g(e)de = """"'h2 de, (5.5-16)

e independiente de la energía (ejercico 3, capítulo 5). En esta fórmula, A representa


el área del "recipiente" bidimensional. Para este sistema, (5.5-14) se convierte en

41tmA roo de
N= -¡¡r- Jo i + e<•-•¡)/kT• (5.5-17)

que se puede evaluar en forma cerrada, haciendo que uno resuelva para e¡ y se
obtiene
e1(T) = kT ln(e•t<O)/kT- 1), (5.5-18)
en donde
Nh 2
e¡(0)=-- (5.5-19)
41tmA

es el valor que ej(1) toma conforme T tiende a cero, como está dado por (5.5-18).
Los detalles del cálculo de este resultado son muy instructivos y quedan asignados
como ejercicio para el lector. La variación de la energía de Fermi del gas bidimen-
sional de partículas independientes se ilustra en la figura 5.9. Se notará en este caso,
que la energía de Fermi es una función monotónica decreciente de la temperatura.
La energía de Fermi para el gas de Fermi tridimensional, con la función de densidad
de estados (5.2-22), presentará el mismo comportamiento general, excepto que en
este caso, la variación de la energía de Fermi con respecto a la temperatura es lineal
cuando los valores de ésta se mantienen razonablemente bajos, en tanto que para el
ejemplo bidimensional, la variación es mucho más compleja a temperaturas bajas.
Para muchos sistemas, incluyendo estos dos, la variación del nivel de Fermi con
respecto a la temperatura es p~queña sobre el rango de temperaturas físicamente
posibles; en la figura 5.9, la temperatura a la que e¡= O sería del orden de
75000°K para un gas de electrones con la densidad de electrones libres correspon-
diente a la del cobre metálico. Por esta razón, en muchas aplicaciones la depen-
dencia de temperatura de la energía de Ferrni se puede desechar o aproximar me-
diante una función lineal u otra apropiada de la temperatura.
La función de distribución de Fermi propiamente dicha,

1
/(e) = 1 + e<•-•,>tkT ' (5.5-20)
172 Mecánica estadística. Generalidades

., (T)

Figura 5.9. Representación esquemática de la variación de la energía de Fermi en función de la


temperatura, en un gas bidimensional de electrones libres, de acuerdo con (5.5-18).

se muestra en la figura 5.10 para varios valores de temperatura. Puesto que sólo
una partícula puede ocupar un estado cuántico dado, el valor de f(e) para una dis-
tribución de Fermi a una energía partícular es justamente igual a la probabilidad
de que un estado cuántico de dicha energía esté ocupado. En el cero absoluto,
como se puede ver fácilmente en la figura 5.10 y por la ecuación (5.5-20), la
función de distribución de Fermi se convierte sencillamente en una función de escalón

f(e) =1 (e< e1 )
(5.5-21)
=O (e> e1 ).

Conforme aumenta la temperatura, los bordes del escalón se redondean y la


función de distribución varía rápidamente desde casi la unidad hasta casi cero sobre
un rango de energía de algunos múltiplos de kT alrededor del valor e = e1. Al
mismo tiempo, el valor de e¡ cambia y la variación ilustrada en la figura 5.10 es
aproximadamente la que se asocia con el gas electrónico tridimensional, cuya den-
sidad de estados está dada por (5.2-22). A temperaturas muy elevadas, la función de

Figura 5.10. Representación esquemática de la función de distribución de Fermi para cuatro


diferentes temperaturas. Obsérvese la variación de la energía de Fermi con la
temperatura. La dependencia de la energía de Fermi en relación a la temperatura,
tal como se muestra aquí, es típica para un gas tridimensional de electrones libres;
pero la variación real en cualquier sistema en particular depende críticamente de
la función de densidad de estados (o nivel de degeneraciones) del sistema.
Estadístictl de Fermi-Dirac 173

distribución pierde su característica de escalón y varía con más lentitud en función


de la energía. De acuerdo con (5.5-20), es evidente que el valor de !(e) a e= e¡ es
sólo l/2, es decir,

(e1 ) =t. (5.5-22)

de donde, un estado cuántico al nivel de Fermi tiene la probabilidad de ocupación


de l/2.
En la figura 5.11 se muestra la distribución real de la densidad de partículas
.V(e) como una función de la energía para un gas de Fermi de partículas indepen-
dientes, dada por (5.5-13) con la función de densidad de estados (5.2-22). Nueva-
mente, en T =O, la curva tiene un carácter escalonado; así la porción para la que
(e< e¡) es la parábola de densidad de estados (5.2-22) y para la que (e> e¡) es
.:ero. Al aumentar la temperatura, este aspecto escalonado se hace cada vez menos
pronunciado, como se ilustra en el dibujo. A temperaturas bajas, cuando la función
de distribución de Fermi es escalonada, se dice que la distribución está sumamente
degenerada.
A temperaturas bajas, la distribución de Fermi-Dirac se puede representar como
una esfera en el espacio de cantidad de movimiento en el que todos o casi todos los
estados cuánticos de energía menor que e1 están llenos, en tanto que todos o la
mayoría de los estados de energía mayores que e1 están vacíos. De acuerdo con
f 5.2-14), la ecuación de la superficie de esta "esfera Fermi" debe ser

Px2 + Py2 + Pz2 = 2 me¡, (5.5-23)

de donde, el radio es ..J2me1 , como se ilustra en la figura 5.12. A temperaturas muy


altas, la superficie de la esfera de Fermi está definida muy deficientemente debido a
la desaparición de bs aspectos escalonados de j(f), y el concepto resulta menos útil.
Entonces, se llega a la conclusión que ta integral (5.5-15) no puede evaluarse
en forma exacta y esto no permite encontrar una expresión simple para la energía
de Fenni de un gas de Fermi tridimensional a todas las temperaturas; sin embargo el
.:arácter simple (5.5-21) que adopta la función en T= O permite evaluar er de un
modo muy sencillo en el cero absoluto. Si se utiliza (5.5-:ll) para representar !(e)
en T =O, se puede volver a escribir (5.5-14) utilizando la función de densidad de
estados (5.2-22) como

N = 8J2nm 312 r•¡(O) Jede = 16j2nm 3 ' 2 [e¡(0)] 3 ' 2


(5.5-24)
V h3 Jo 3h 3

N(.)

Figura 5.11. Representación esquemática de la densidad electrónica como función de la energía


asociada a un gas tridimensional de electrones libres.
174 Mecánica estadística. Generalidades

( r- eje .lal papel l

Figura 5.12. La distribución de Fermi al cero absoluto correspondiente a un gas de electrones


libres, representada, por medio de una esfera de electrones dentro del espacio de
cantidad de movimiento. Esta representación es útil siempre y cuando T<t.Tp.

Resolviendo esta ecuación para ej(O), se obtiene

h2
e¡(O) = - -
(3N)2/3 . (5.5-25)
8m 1rV

De un modo similar, se puede obtener la energía interna de un gas de Fermi


al cero absoluto, siendo el resultado

U0 _ 1th 2 (3N) 3_3N


5'
V- 40m 1rV -5 V e¡(O). (5.5-26)

Los detalles de estos cálculos se omiten, pero se proponen como ejercicio para el
lector.
Para energías mucho mayores que er, e<e-e¡)fkT es mucho mayor que la unidad
y para tales energías, la función de dÍstribución de Fermi-Dirac (5.5-20) se puede
escribir aproximadamente como

(5.5-27)

Si todas las energías disponibles para el sistema satisfacen la condición

e- e1 ~ kT, (5.5-28)

es decir, si e¡ es muchas unidades kT menor que cualquier energía que pueda tener
una partícula perteneciente al sistema, entonces (5.5-27) constituirá una buena apro-
ximación de (5.5-20) para todas las partículas del sistema. Sin embargo, la función
de distribución aproximada (5.5-27) es, sencillamente, la función de distribución de
Maxwell-Boltzmann de (5.4-6) con a= e¡/kT. Entonces, si se conserva la condición
(5.5-28) para todas las partículas del sistema, la distribución Fermi-Dirac y la de
Maxwell-Boltzmann son casi iguales.
Estadística de Fermi-Dirac 175

Para el gas bidimensional de Fermi, donde la energía de Fermi está dada por
(5.5-18), si T es tan grande que kT'> e¡(O), el exponente e¡(O)/kT será pequeño, de
tal manera que el exponencial se puede aproximar mediante 1 + [e¡(O)/kT], dando

e (T) = kT In e¡(O)
1 kT

= (O)[ kT 1 B¡(O)]
81 e1(0) n kT

kT kT]
= -e¡(O) [ e¡(O) In e¡(O) . (5.5-29)

De acuerdo con esto, se advierte que conforme T aumenta, e¡(T)-+- oo. Pues-
to que la energía más baja que puede tener cualquier partícula del sistema es cero,
es evidente que la condición (5.5-28) se satisfará para temperaturas lo suficiente-
mente altas y la función de distribución será aproximadamente la misma que la de
la distribución de Maxwell-Boltzmann a temperaturas muy elevadas. Se puede demos-
trar que el mismo resultado se aplica al caso tridimensional. Estos resultados también
pueden esperarse si se emplea un enfoque físico, ya que a altas temperaturas, las
partículas se distribuyen sobre un rango muy amplio de estados energéticos, y el
número de partículas en cada rango de energías disponibles es tan pequeño que
siempre hay mucho más estados cuánticos disponibles que partículas que puedan
ocuparlos. En estas circunstancias, la probabilidad de que dos o más partículas ocu-
pen el mismo estado cuántico siempre se hace sumamente pequeña de modo que no
importa mucho si la función de distribución obedece al principio de Pauli (distri-
bución Fermi-Dirac) o no lo obedece (distribución Maxwell-Boltzmann). 3 Puesto que
la cantidad e¡(O), que deber ser obligatoriamente mucho menor que kT para que las
dos distribuciones coincidan, es proporcional a la densidad de partículas N/A por
(5.5-19), la reducción de la distribución de Fermi a una reducción de Maxwell-Boltz-
mann se desarrollará a temperaturas más bajas en gases menos densos. Por las mis-
mas razones, de acuerdo con ( 5.5-19), se producirá a temperaturas más bajas en
gases en las que la masa de las partículas m sea grande. Debido a ello, las substan-
cias gaseosas ordinarias a temperaturas normales obedecen a la estadística de Maxwell-
Boltzmann mejor que a la estadística Fermi-Dirac (o Bose-Einstein). Sin embargo,
para un gas denso de partículas muy ligeras, tales como los electrones libres de un
metal, la energía de Fermi al cero absoluto es bastante grande y la condición
(5.5-28) se puede satisfacer para todas las partículas del sistema sólo a temperaturas
tan altas que sean físicamente inalcanzables. Por tanto, cuando se trata de un gas
denso de electrones libres, debe utilizarse la estadística de Fermi-Dirac. No obstante,
en los semiconductores, la forma peculiar de la función de densidad de estados es
tal que la distribución de Maxwell-Boltzmann casi siempre es una aproximación acep-
table de la distribución de Fermi-Dirac o prácticamente igual a ella. Esta situación
se examinará más detalladamente en un capítulo posterior.

3 Se podría alegar que aun en este límite la distribución de Fermi-Dirac debe diferir de la
de Maxwell-Boltzmann en virtud de que no se pueden identificar las partículas. Sin embargo, se
puede demostrar, como se verá en la siguiente sección, que la función de distribución de par-
tículas no distinguibles, que no obedecen el principio de exclusión de Pauli (la distribución
Bose-Einstein), se aproxima a la función de distribución Maxwcii-Boltzmann en este límite. Una
forma más exacta de explicar la situación sería afirmar que, en el límite de altas temperaturas,
la distribución Fermi-Dirac se acerca a la distribución Bose-Einstein que, a su vez, se acerca a la
distribución Maxwell-Boltzmann.
176 Mecánica estadística. Generalidades

Si se hubiera escogido para el multiplicador (3, otro, diferente al dado por


(5.5-10), no se habría encontrado, por lo general, la correspondencia entre los sis-
temas Fermi-Dirac y Maxwell-Boltzrnann en el límite de las temperaturas altas que,
como ya se vio, se puede esperar por razones físicas. Por tanto, se debe llegar a la
conclusión de que el valor de (3 dado por (5.5-10) está físicamente justificado.

5.6 LA DISTRIBUCION HOSE-EINSTEIN

En la sección anterior se demostró que la distribución estadística de Fermi-


Dirac (5.5-20) es la que caracteriza el comportamiento de un conjunto de partículas
no distinguibles que obedecen al principio de exclusión de Pauli. Puesto que no
todas las partículas elementales obedecen el principio de Pauli (siendo la excepción
más conspicua los fotones), es necesario considerar el comportamiento de las partí-
culas no distinguibles, que no obedecen este principio. También en este caso, puesto
que las partículas no están numeradas, el factor ( 5.3-7) se reduce a la unidad y sólo
es necesario considerar las posibles permutaciones de N¡ partículas idénticas entre g¡
estados cuánticos de iésimo nivel energético; pero ahora sin ninguna restricción en lo
que respecta al número de partículas que pueden ocupar cualquier estado cuántico
dado.
Sea un arreglo lineal de N¡ partículas y g¡ - 1 particiones que serían necesarias
para dividir estas partículas en g¡ grupos, como se ilustra en la figura 5.13. No es
difícil ver que el número de formas de permutar las N¡ partículas entre g¡ niveles, es
igual al número de permutaciones independientes de objetos y particiones de la
figura 5.13. Puesto que se tiene un total de N¡+ g¡- 1 partículas más las parti-
ciones, éstas se pueden arreglar linealmente en (N¡+ g¡- 1)! formas; pero puesto
que las permutaciones que se hacen entre las partículas y entre las particiones no
se consideran como acomodos independientes, el número de acomodos se debe di-
vidir entre el número de maneras de permutar las partículas entre ellas mismas (N¡! )
y nuevamente entre el número de maneras de permutar las particiones entre ellas
mismas ((g¡- 1)! ), dando

(N;+ g¡- 1)!


(5.6-1)
N;!(g;- 1)!

formas de realizar una distribución de N¡! partículas no distinguibles entre g¡ esta-


dos que pueden alojar a cualquier número de partículas. Fl número Qb de formas
estadísticamente independientes de lograr una distribución (N 1 , N 2 , • • • Nn) de par-
tículas entre los niveles energéticos del sistema, de acuerdo con estas reglas, es

•• • •• •• •• • ••• •
iésimo nivel de energía: degene.r.ación 9; =9
poblac10n N;= 14

Figura 5.13. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
< ncr?,ético
de un sistema en el que no se aplica el principio de exclusión de Pauli.
La distribución de Rose-Einstein 177

simplemente el producto de los factores de la forma (5.6-l) sobre todos los niveles
del sistema por lo que

(5.6-2)

Ahora se puede maxlinizar esta cantidad con r~specto a las variables N¡, N 2 : • • •
Nn, utilizando el método de los multiplicadores de Lagrange y de acuerdo con las res-
tricciones (5.3-22) y (5.3-23). Los cálculos no se incluirán aquí; pero se sugiere que
los ejecute el lector como ejercicio. El resultado es
1
(5.6-3)

Esta fórmula se conoce como función de distribución Bose-Einstein. También


ahora se puede identificar (3 como

{3 = -1/kT, (5.6-4)

mientras que a puede determinarse de acuerdo con el número de partículas del


sistema, al igual que se hizo en los casos Maxwell-Boltzmann y Fermi-Dirac. Para el
caso de un continuo de niveles muy poco espaciados entre sí, g¡ ~ g(c)d€ y
N¡~ N(c)dc, lo cual da

(5.6-5)

Para la función de densidad de estados de partículas independientes ( 5.5-16)


correspondiente a un gas bidimensional de partículas libres, el parámetro a se puede
calcular explícitamente en la misma forma que e¡ para este sistema, de acuerdo con
la estadística Fermi-Dirac. Se puede demostrar entonces que conforme T se incre-
menta, a~- oo, en cuyo caso el factor exponencial del denominador de (5.6-5) se
hace mucho mayor que la unidad y la distribución Bose-Einstein (5.6-5) tiende a

(5.6-6)

que es una función de distribución del tipo de Maxwell-Boltzmann. Se puede obte-


ner el mismo comportamiento general para un gas de Base-Einstein tridimensional de
partículas independientes, aunque en este caso no es posible obtener una expresión
para a en forma exacta.
En el límite de las temperaturas muy altas, las partículas del sistema se distri-
buyen sobre un rango muy amplio de energía, y el número de partículas en cada
rango de energía disponible será mucho más pequeño que el número de estados
cuánticos de dicho rango, de donde, para todos los estados g¡ :>N¡. En esta situa-
ción, se puede escribir, aproximadamente,

(N; + g¡ - 1)! ~ N;
(g¡-1)! =g¡, (5.6-7)

de donde, (5.6-2) se convierte en

(5.6-8)
178 Mecánica estadística. Generalidades

Cabe notar que esto, aparte de un factor constante N! , es igual a


Q(N 1 , N 2 , • • • Nn) como está dado por (5.3-8) para un sistema Maxwell-Holtzmann.
Entonces, desde un punto de vista puramente físico se debe esperar que las distri-
buciones Hose-Einstein y Maxwell-Holtzmann coincidan en el límite de altas tempe-
raturas. La selección del valor dado por (5.6-4) para (j está entonces justificado, ya
que esta selección, como se vio antes, lleva directamente a la correspondencia entre
la estadística Hose-Einstein y Maxwell-Boltzmann indicada por (5.6-6).
En el caso de los gases bidimensional y tridimensional de partículas indepen-
dientes de Hose-Einstein, conforme la temperatura se acerca a cero, el valor de a
tiende a cero y el resultado es que todas las partículas del sistema tienden a conden-
sarse en el estado energético más bajo del sistema al cero absoluto. Este fenómeno,
denominado condensación de Hose, es característico de los sistemas que obedecen la
estadística de Bose-Einstein.
En algunas aplicaciones, conviene obtener la función de distribución Base-
Einstein, sin establecer la restricción de que el número de partículas del sistema sea
constante. De acuerdo con (5.3-15) y (5.3-16), se puede ver que este resultado se
puede obtener de (5.6-5), si se supone que a es idéntica a cero. En este caso,
(5.6-5) se reduce a

1
f(e) = e/kT · (5.6-9)
e - 1

EJERCICIOS
l. Demuestre que el frente de onda asociado con la onda plana 'Ir= ei(k•r-wt) avanza en
la dirección k.
2. Demuestre, para la partícula libre en tres dimensiones cuya función de onda está dada
por (5.2-7), que el valor esperado de la cantidad de movimiento vectorial p es igual a hlc, y que
p (y, por ende, k) es una constante del movimiento.
3. Calcule la densidad del factor de estados g(e)de para un sistema bidimensional de partí-
culas libres, en el que no hay otras interacciones que colisiones instantáneas y que está conte-
nido en un recipiente rígido de superficie A y de dimensiones x 0 y y 0 . Comience con la ecuación
de SchrOdinger.
4. Suponga que se lanzan simultáneamente cuatro monedas, ¿cuáles son las probabilidades
asociadas con las distribuciones (0 águila, 4 sol), (1 águila, 3 sol) ... (4 águila, O sol)?
5. Encuentre las dimensiones y la superficie del rectángulo de área máxima con lados
paralelos a los ejes de las coordenadas, que se puede inscribir dentro de una elipse cuyo eje
mayor es 2a y cuyo eje menor es 2b. Los ejes de la elipse pueden considerarse paralelos con los
ejes de las coordenadas. Emplee el método de los multiplicadores de Lagrange.
6. Encuentre la velocidad de raíz cuadrada media y la velocidad más probable de una
partícula en un gas ideal de Boltzmann.
7. Demuestre que el flujo de partículas en un gas ideal de Boltzmann, cuyas componentes
x de velocidad son positivas, por unidad de área sobrt> un plano normal al eje x es -!Nc7V.
Nota: el flujo o densidad de corriente se define como el número de partículas por unidad de
volumen por su componente de velocidad a lo largo de la normal al plano sobre el que se
observa el flujo.
8. Demuestre que la energía de Fermi de un gas de Fermi bidimensional de partículas
libres cuya función de densidad de estados está dada por el resultado del ejercicio 3, es ej{T) =
kTin(eEj{O)fkT- 1), en donde et{O) =Nh2f(4rrmA)
9. Calcule la energía de Fermi, en electrón-volts, para los electrones libres en el cobre al
cero absoluto, suponiendo que hay un electrón libre por átomo de cobre. Indique la temperatura
a la que kT será igual a ef.O).
10. Demuestre que la energía interna por unidad de volumen de un gas de Fermi de
partículas libres al cero absoluto es ~!!.. ej(O).
5 V
11. Demuestre por el método de los multiplicadores lagrangeanos, que si Q(N ¡, N 2 , • • • Nn)
está dada por la ecuación (5 .6-2), la función de distribución correspondiente a los valores más pro-
bables dé N •· N2, • • • Nn, está dada por (5.6-3).
La distribución de Rose-Einstein 179

12. Use la función de densidad de estados calculada en el ejercicio 3 para demostrar que
d parámetro a de un gas de Bose-Einstein bidimensional de partículas libres está dado por
IX= )n(l _ e-h2N/(2nAmkT)).

Analice las propiedades de la función de distribución resultante para T--'>- oo y para T-+ O.

LECTURAS RECOMENDADAS

W. Band, An Introduction to Quantum Statistics, D. Van Nostrand, Princeton, N. J. (1955).


R. W. Gurney, Introduction to Statistical Mechanics, McGraw-Hill Book Co., lnc., Nueva York
(1949).
D. ter Haar, Elements of Statistical Mechanics, Holt, Rinehart and Winston, lnc., Nueva York
(1954).
R. B. Lindsay, Introduction to Physical Statistics, John Wiley and Sons, Nueva York (1941).
J. E. Mayer y Maria Gi:ippert-Mayer, Statistical Mechanics, John Wiley and Sons, Nueva York
(1940).
R. C. Tolman, The Principies of Statistical Mechanics. Oxford University Press, Londres (1938).
CAPITULO 6
Vibraciones reticulares y
propiedades térmicas de los cristales

6.1 CALCULOS CLASICOS DEL CALOR ESPECIFICO RETICULAR

En la sección 4.4 se delinearon algunos de los problemas que se presentan


cuando se calcula el calor especifico de un cristal, suponiendo que los átomos de
dicho cristal se comportan como osciladores armónicos clásicos independientes. Aho-
ra se examinarán estos problemas detalladamente y se estudiará la forma en que se
pueden resolver, usando los resultados obtenidos en los capítulos 3-5, relacionando
la dinámica reticular, la mecánica cuántica y la mecánica estadística. En todas estas
investigaciones se tratará de un cristal compuesto de N átomos, que se mantienen
unidos en un arreglo periódico. Se supone que estos átomos sólo pueden vibrar
alrededor de sus posiciones de equilibrio ya que están sometidos a fuerzas restrictivas
que, en una primera aproximación, obedecen a la ley de Hooke. También se supone
que no hay electrones libres, como se encontrarían en un metal, y que toda la
capacidad calorífica del cristal se debe a las vibraciones de la red producidas por
excitación térmica. Cuando hay electrones libres, también, se puede lograr que se
muevan excitándolos por medio de una fuente calorífica externa y, entonces, su
movimiento ocasiona un aumento en el calor específico observado; esto se estudiará
en un capítulo posterior.
El cálculo clásico supone que cada átomo es un oscilador armónico clásico
tridimensional que vibra independientemente de todos los demás átomos del cristal.
En estas circunstancias, se puede calcular la energía térmica interna total del cristal
determinando la energía promedio de un solo oscilador y multiplicando el resultado
por N. Para un solo oscilador armónico isotiópico tridimensional, la energía total es
p2
e=-+ V(r) (6.1-1)
2m
siendo
(6.1-2)

en donde m es la masa y w 0 la frecuencia natural del oscilador. Si se supone que la


distribución de los osciladores por energía obedece a la ley de distribución Maxwell-
Boltzmann, la función de distribución que expresa la probabilidad de que un osci-
lador tenga una energía dada E es
pl mwo2r2

f(c.) = Ae-•lkT = Ae- 2mkT e- 2fT= f(p,q) (6.1-3)

181
182 Vibraciones reticulares y propiedades térmicas de los cristales

en donde A es una constante. De acuerdo con (5.2-4), la energía promedio está


dada por

(6.1-4)

En este caso se prefirió usar coordenadas esféricas (r, e, cf>) para el espacio de
las coordenadas y (p, eP, cf>p) para el espacio de la cantidad de movimiento, para
fines de integración la cual, por supuesto, debe hacerse sobre todo el espacio de
fase. Puesto que el integrando no tiene dependencia en relación de e, p, ep, o 'cf>p la
integración sobre estas variables se puede desarrollar de un modo muy sencillo,
dando un factor de 41T tanto al numerador como al denominador, y dejando

_1_foo p4e- 2~~T dp m;~ foo r4e- m~~~z dr


2m o (~ ) + (~"p) • (6 1 5)
(e) = foo pZ + foo o mm >rZ 0
-
- "k • -
p2e2mkT dp r2e 2kT dr
o o

En el primer término de (6.1-5), cada doble integral de (6.1-4) se ha expresado


como un producto de una integral p y otra integral r; las integrales r del numerador
y el denominador son iguales y se anulan, dando el primer término de la expresión
antes presentada. El segundo término se maneja en la misma forma; pero en este
caso las integrales de p del numerador y el denominador son las que se cancelan. Es
evidente que el primer término de la expresión anterior representa la energía cinética
promedio y el segundo la energía potencial promedio. Al evaluar las integrales con la
ayuda de la tabla 5.1, se encuentra que

(6.1-6)

Para un conjunto de N oscilaciones independientes, la energía interna total U


es, sencillamente,

U= N(e) = 3NkT, (6.1-7)

y la capacidad térmica Cv es, por definición,

Cv = (8Uf8T)v = 3Nk. (6.1-8)

El calor específico es la capacidad calorífica por gramo (o por unidad de


volumen). La capacidad calorífica es una constante independiente de la temperatura.
Para un mol de cualquier substancia, N es igual al número de Avogrado Na y la
capacidad calorífica molar Cvm está dada por

(6.1-9)

Este resultado se conoce como la ley de Dulong y Petit, y los alumnos que
han estudiado química elemental están familiarizados con ella ya que es la base de
una forma rudimentaria de estimar el peso atómico de un elemento desconocido. La
Teoría de Einstein sobre el calor específico 183

Cvm

~i"!'O:....__~I0'-0---2-'0-0---30-'--0---4.L.OO--- T ("K)

Figura 6.1. Capacidad térmica de una substancia sólida típica graficada como una función de la
temperatura.

ley de Dulong y Petit concuerda totalmente con los resultados experimentales obte-
nidos con la mayoría de las substancias a la temperatura ambiente y por encima de
ella; pero conduce a errores notables a temperaturas bajas. En el rango de tempera-
turas bajas, el calor específico de todas las substancias tiende a cero siendo propor-
cional a P conforme T se acerca a cero, como se ilustra en la figura 6.1.

6.2 TEORIA DE EINSTEIN SOBRE EL CALOR ESPECIFICO

Einstein investigó las discrepancias en la teoría clásica del calor específico y,


en 1911, logró explicar cualitativamente el calor específico (por lo menos en su
forma observada y desde un punto de vista experimental) como una función de la
temperatura. En la teoría de Einstein, los átomos se consideraban nuevamente como
osciladores armónicos independientes e idénticos con una sola frecuencia de vibración
natural w 0 , pero se toman como osciladores cuánticos armónicos que pueden tener
sólo valores discretos de energía 1 tales que

(n = 0,1,2, · · · ), (6.2-1)

como está dado por ( 4.12-27). Se puede considerar que los osciladores tienen una
distribución de energía del tipo Maxwell-Boltzmann, ya que forman un conjunto de
sistemas que son distinguibles o identificables en virtud de su ubicación en puntos
separados y distintos de la red, y puesto que cualquier número de osciladores puede
estar en cualquier estado cuántico del sistema. Por tanto, aunque los átomos son
osciladores cuantizados, la distribución clásica de Maxwell-Boltzmann sigue siendo la
más apropiada para describir su comportamiento estadístico. Por otro lado, los verda-
deros cuantos de energía vibratoria que absorben o emiten los osciladores, no son
entidades distinguibles y, por tanto, la estadística de Bese-Einstein se debe utilizar

1 Por supuesto, Einstein utilizó el resultado de Planck En = nl'k.u más bien que el resultado
de la mecánica ondulatoria que se da en (6.2-l) para los niveles de energía de un oscilador
armónico. Si se usa el resultado original de Planck, la expresión final de la energía interna y el
calor específico que se obtienen difieren de los resultados aquí derivados, ~ólo en la <lll~encia de
una contribución energética de punto cero independiente de la tl'mpcratura a la energía interna
184 Vibraciones reticulares y propiedades térmicas de los cristales

para describir su comportamiento estadístico. Como se verá más tarde, se pueden


obtener los mismos resultados analizando las propiedades del sistema de osciladores de
acuerdo con la estadística Maxwell-Boltzmann, o bien manejando la dinámica de los
cuantos de energía vibratoria por medio de la estadística de Bose-Einstein.
Para mayor simplicidad, se supondrá que el cristal contiene 3N osciladores
armónicos unidimensionales cuyos niveles de energía están dados por (6.2-l), en
lugar de N osciladores isotrópicos tridimensionales. Esta suposición se justifica, ya
que existen tres grados de libertad de vibración independiente relacionados con cada
átomo del cristal y que, de acuerdo con el principio de equipartición, la energía
vibratoria disponible se distribuye de un modo equitativo, en promedio, entre estos
tres grados de libertad. Si la energía se distribuye entre los osciladores de acuerdo
con la ley de Boltzmann, el número de osciladores a la energía e es proporcional a
e- efKT y la energía promedio es

(6.2-2)
¿ e<n+t)x
n

en donde
x = -liw0 /kT. (6.2-3)

Sin embargo, la ecuación 6.2-2 se puede escribir como

(6.2-4)
La energía interna se obtiene multiplicando la energía promedio por oscilador,
por el número de osciladores, como antes, de donde,

3Niiw 0 3Niiw 0
U= 3N(e) = --2- + eftwa/kT- 1 (6.2-5)

e = (-aaTu_)
V V
= 3 N k (-liw_o) 2 ---;:--e~=Wo,...lk_T--::
kT (eftwo/kT- 1)2. (6.2-6)

Este resultado se puede expresar en una forma algo más s~ncilla definiendo
una "temperatura de Einstein" 8¡.; tal que

liw 0 = k0E. (6.2-7)


Al substituir k8E en lugar de hw 0 en (6.2-6), se tiene que

(6.2-8)
Teoría de Einstein sobre el calor específico 185

Para temperaturas lo suficientemente altas para que T~ eE, e0 EIT:::: 1; utili-


zando la expansión de series de potencias para la exponencial y reteniendo sólo los
términos de primer orden, se puede ver fácilmente que en este límite, Cv se acerca
al resultado clásico 3Nk. Para temperaturas bajas (T <1!; SE), e0 EIT ~ 1 y (6.2-8) se
puede aproximar mediante

(6.2-9)

.:¡ue se acerca a cero conforme T tiende a cero, aunque no concuerda con el com-
portamiento T3 observado a temperaturas bajas. El primer término de (6.2-5) repre-
senta la parte de energía interna del sistema que corresponde a la energía de punto
~ero de los osciladores. Puesto que es independiente de la temperatura, no hace
\·ariar el valor del calor e~pecífico.
Físicamente, la razón de que el calor específico se haga tan pequeño a tempe-
raturas bajas se puede entender suponiendo que el cristal se coloca de tal modo
que hace contacto con un baño térmico externo compuesto de un gas monoató-
mico ideal a una temperatura dada y se deja que absorba energía de los átomos del gas
ideal. La energía promedio de los átomos del gas es 3/2kT y si la temperatura del
sistema es lo suficientemente alta, de tal modo que kT sea por lo menos del orden
de la energía líw 0 requerida para excitar uno de los átomos vibrantes del cristal a
un estado energético más alto, tales excitaciones ocurrirán frecuentemente, al chocar
~on el cristal los átomos del gas del baño térmico. Entonces, estas colisiones serán
inelásticas en el sentido mecánico y la energía que inicialmente pertenecía a los
átomos del gas se transferirá con facilidad a la red cristalina como energía de
\"ibración. Por otro lado, a temperaturas lo suficientemente bajas, kT será mucho
más pequeña que la energía de excitación líw 0 , y sólo un átomo ocasional de gas
que tenga una energía mucho mayor que la promedio podrá producir una excitación
de esta índole y, por tanto, transferir calor a la red cristalina. Luego, el cristal tiene
relativamente poca capacidad para absorber calor de su ambiente y un cambio unita-
rio de temperatura en el ambiente sólo ocasiona la transferencia al cristal de una
cantidad de calor muy pequeña, en comparación con la que se puede transferir en con-
niciones similares a temperaturas más altas. Conforme la temperatura se acerca al cero
absoluto, la fracción de átomos del baño térmico que poseen la mínima energía de ex-
citación hw 0 tiende a cero, y en consecuencia, también lo hace el calor específico.
La temperatura de Einstein SE = líw 0 /k se puede calcular fácilmente si se
conoce w 0 . Esta frecuencia natural de vibración se puede calcular a partir de la
masa atómica y las constantes elásticas observadas del cristai.2 Para muchos elemen-
tos metálicos, el valor calculado de esta manera es del orden de 100-200°K y, por
ende, la transición del comportamiento a bajas temperaturas al de altas temperaturas
debe ocurrir en este rango de temperaturas. Experimentalmente, se ha encontrado
que la teoría de Einstein satisface las observaciones en todas las temperaturas, excep-
to las bajas, en donde el comportamiento de T3 observado no se puede obtener. Por
lo general, los valores calculados de SE y los que se obtienen aplicando la expresión
teórica (6.2-8) a datos observados, también concuerdan con bastante exactitud. Evi-
dentemente, la teoría de Einstein proporcionó una explicación mucho mejor de los
datos experimentales que la teoría clásica, a pesar de que la coincidencia con la
experiencia no es perfecta. La teoría de Debye, de 1912, permitió eliminar la discre-
pancia entre la teoría y Jos resultados experimentales a baja temperatura y mejoró la
aceptación general de Jos datos experimentales. En la teoría de Debye, se toman en

2 Véase el capítulo 3, ejercicio 6.


186 Vibraciones reticulares y propiedades térmicas de los cristales

cuenta las interacciones entre los átomos que dan como resultado que exista un
rango de valores posibles de frecuencia vibratoria en lugar de un solo valor Wo,
como se describió en el capítulo 3.

6.3 TEORIA DE DEBYE SOBRE EL CALOR ESPECIFICO

La teoría de Debye sobre el calor específico, primeramente propuesta en


1912, 3 consideraba a los átomos de los cristales como osciladores que están acopla-
dos y que pueden propagar ondas elásticas cuya frecuencia varíe sobre un amplio
rango de valores, como lo predicen los cálculos del capítulo 3. Aunque todavía se
obtienen algunos resultados que son aproximaciones, se encontró que eran superior
al modelo de Einstein en lo que respecta a las predicciones sobre el calor específico
de substancias en la región de temperaturas bajas. Además, proporcionó una base
para varias investigaciones subsecuentes más detalladas.
Puesto que de acuerdo con lo anterior, los átomos del cristal no vibran inde-
pendientemente unos de otros, es más conveniente trabajar con los modos normales
de vibración del sistema, que con el movimiento vibratorio de un solo átomo. Ya se
vio (en la sección 3.3 y el ejercicio 7, capítulo 3), que para una cadena lineal
unidimensional de N átomos, existen esencialmente N modos normales de vibración.
En el caso de un cristal tridimensional de N átomos, cada átomo puede vibrar
independientemente a lo largo de las tres direcciones de las coordenadas, de manera
que, para este sistema, se tienen 3N modos normales posibles. Puesto que cualquier
movimiento vibratorio del sistema se puede considerar como una superposición de
vibraciones independientes de modo normal, los modos normales se pueden tomar
como oscilaciones armónicas independientes cuyos niveles de energía permisibles es-
tán dados por (6.2-1) y cuya energía promedio está dada por (6.2-4), a condición de
que el número de modos normales excitados estén distribuidos en cuanto a energía
de acuerdo con la ley de distribución de Maxwell-Boltzmann.
Supóngase ahora que en un rango de frecuencia dw alrededor de la frecuencia
w, existen g( w) dw modos normales de vibración del cristal. En consecuencia, la
cantidad g(w) debe representar el número de modos normales por unidad de fre-
cuencia a la frecuencia w. El aumento de la energía vibratoria interna del cristal,
producido por estos modos de vibración, está dada por

dU = (e(w))g(w) dw (6.3-1)

en donde (e(w)) es la energía promedio de un modo de vibración de frecuencia w,


según lo establece la fórmula (6.2-4). Es más conveniente calcular el número de
modos normales g(k) dk en un intervalo dk alrededor del número de onda k, y,
puesto que dk = (dk/dw)dw (6.3-1) se puede escribir como

dk
dU = (e(w(k)))g(k) dk = (e(w))g(k)- dw. (6.3-2)
dw

Para calcular g(k), sea un cristal rectangular cuyas dimensiones son (Lx, Ly, Lz)
y supóngase que el origen se encuentra en un vértice del cristal, y que los bordes
del cristal coinciden con los ejes + x, +y y + z. Las ecuaciones de movimiento de

~ P lkhyc, Ann. Physik 39, 789 (1912).


Teoría de Debye sobre el calor específico 187

la amplitud mecánica vibratoria u(x, y, z, t), conduce entonces a soluciones vibra-


torias de la forma

(6.3-3)
Si a la expresión (6.3-3) se aplican las condiciones periódicas de frontera de la
forma

u(L",y,z,t) = u(O,y,z,t)

u(x,L,,z,t) = u(x,O,z,t) (6.3-4)

u(x,y,L.,t) = u(x,y,O,t)

k" = 21tnxf L"

k,= 21tn,JL, (6.3-5)

en donde nx, ny, nz son enteros positivos o negativos. Los valores permisibles
(kx, ky, kz), a los cuales corresponde un solo modo normal de vibración que satis-
facen las condiciones periódicas de frontera, se pueden graficar como puntos en un
espacio k ortogonal, como el que se ilustra en la figura 6.2. Los modos normales
permisibles forman una red ortorrómbica simple en este espacio, siendo las dimen-
siones de la célula unitaria (2rr/Lx, 2rr/Ly, 2rr/Lz).

Figura 6.2. Superficies esféricas corre~pondientes a valores constantes de la constante de pro-


pagación k Y k +dk, graficadas en un sistema de coordenadas (kx, k y, kz)·

Si las dimensiones del cristal Lx, Ly, Lz son lo suficientemente grandes, la


célula unitaria se hará pequeña y los puntos que representan los modos normales
permisibles se amontonarán en un modo muy semejante al diagrama que aparece en
188 Vibraciones reticulares y propiedades térmicas de los cristales

la figura 6.2. En este caso, se puede calcular g(k) dk, evaluando el volumen del
espacio k entre la superficie esférica de radio k

(6.3-6)

que es el lugar geométrico de todos los puntos correspondientes al número de onda


k, y otra superficie esférica de radio k + dk, que es el lugar geométrico de todos los
puntos cuyo número de onda es k+ dk. El volumen requerido es, sencillamente, el
comprendido entre las dos esferas de la figura 6.2 o 47Tk 2 dk. El número de modos
normales permisibles se obtiene dividiendo esta cantidad entre el volumen de la
célula unitaria correspondiente a un solo modo normal del sistema. Este volumen es
87T 3 f(LxLyLz) = 87T 3 /V, en donde V es el volumen del cristal. Este procedimiento da
como resultado el valor
k2V
g(k) dk = -2 dk.
2n

Sin embargo, existen en realidad tres modos normales independientes para cada
punto permisible en el espacio k, uno correspondiente a una vibración longitudinal
(que ya se vio antes) y los otros dos que corresponden a dos vibraciones transver-
sales mutuamente ortogonales que, hasta ahora, no se han considerado en este aná-
lisis. Para tomar en cuenta esas posibilidades, el lado derecho de la ecuación anterior
debe multiplicarse por un factor de 3, lo cual da finalmente

3k 2 V
g(k) dk = - - 2 dk. (6.3-7)
2n

En este punto, se desearía utilizar alguna relación como la (3.3-7) que expresa
la variación de k como una función de w para una red monoatómica, encontrando
dk/dw y substituyendo los resultados junto con (6.3-7) y (6.2-4) en (6.3-2), e
integrando finalmente sobre w. Born y von Karman, 4 fueron los primeros en deli-
near este procedimiento. Desafortunadamente, la forma matemática de la ecuación es
tal que la expresión resultante es demasiado compleja y no se puede integrar en
forma cerrada o manejarse numéricamente de un modo conveniente. Para contrarres-
tar esta dificultad, Debye aproximó la función sinusoidal (3.3-7) escribiéndola como
una función lineal:
w(k) = v0 k (6.3-8)
en donde v0 es una velocidad de fase (constante) la cual, en principio, es igual a la
velocidad del sonido de onda larga en el cristal. En realidad esto es, lo que indica (3.3-7)
con respecto a longitudes de onda lo suficientemente grandes para satisfacer la con-
dición ka~ 1T, pero Debye utilizó la función para describir el comportamiento de
todas las vibraciones que se pueden propagar dentro del cristal.
La integración sobre w indicada en (6.3-2) se realiza entre los límites cero y
una frecuencia máxima Wm que se escoge de tal forma que el número total de
modos normales de frecuencia menores que Wm deben ser justamente 3N, ya que se
sabe que éste es el número real de modos normales que existen para un cristal de N
átomos. 5 Existe un número de onda km correspondiente a Wm y todos los modos

4 M. Born T. von KJrman, Physikalische /eitschrift U, 297 (1912).


5 Si hubiera sido posible usar una exprc~ión exacta para relacionar
w y k, la integración se
habría desarrollado dentro de los límites de la primera zoua de Brillouin. Esto habría garanti-
!.ado que se hubiera satisfecho automáticamente la condición de que el número total de modos
fu <'SC igual a 3N
Teoría de Debye sobre el color específico 189

nonnales para los que k< km tienen frecuencias w < Wm, de acuerdo con (3.3-7) o
(6.3-8). Por tanto, debe haber solamente 3N modos nonnales de oscilación dentro de
una esfera de radio km en el espacio k. Puesto que el volumen del espacio k
ocupado por un solo modo normal es 81r 3 /3 V, se puede escribir

4 8n 3
-nk 3 = 3N · -
3 "' 3V
o bien
(6.3-9)

por lo cual, utilizando la aproximación de Debye (6.3-8),

W 111 = Vokm = v0 (6Nn 2 /V) 113 • (6.3-10)

La variación de w en función de k, de acuerdo con la aproximación de Debye,


se ilustra y se compara con el valor dado por (3.3-7) en la figura 6.3. En (6.3-10)

"'

Figura 6.3. La verdadera relación de dispersión (curva continua) y la relación de dispersión


(curva punteada) de acuerdo con la aproximación de Debye.

se supone que la velocidad v0 es la misma para ondas elásticas longitudinales y


transversales. Por lo general, esto no es cierto; pero la diferencia no es siempre lo
suficientemente grande para que afecte el resultado final de un modo significativo.
Si ahora se substituye (6.2-4) y (6.3-7) en (6.3-2), utilizando (6.3-8) siempre
que sea necesario expresar k en función de w, e integrando desde cero hasta Wm, se
obtiene

(6.3-11)

La integral del primer término anterior se evalúa fácilmente y origina en el


punto cero un aumento de la energía interna el cual, por otra parte, es indepen-
diente de la temperatura y no modifica en nada el calor específico. La integral del
segundo ténnino no se puede evaluar en fonna exacta; pero se solucionará numérica-
mente.
190 Vibraciones reticulares y propiedades térmicas de los cristales

Por lo general, se acostumbra expresar estos resultados en una forma algo


diferente. Si se hace que

x = hwfkT, (6.3-12)

liv (6Nn
= liwm /kT = ~
2 113

kT -V-
)
x (6.3-13)
m

(6.3-14)

entonces, (6.3-12) se puede escribir en la forma

8
9
U=-Nk0+9NkT 0
"
(T) 3 fa¡T x 3 dx
-x-·
e-1
(6.3-15)
0

Como se puede ver, el parámetro e tiene las dimensiones de la temperatura y


desempeña el papel de una temperatura característica en ( 6.3-15) más o menos en la
misma forma que lo hace la temperatura de Einstein en (6.2-8). e se conoce gene-
ralmente como la temperatura de Debye. Por supuesto, es independiente de la tem-
peratura, excepción hecha de la ligera variación de temperatura introducida por el
cambio de V y de v0 al cambiar la temperatura.
Al derivar (6.3-11), con respecto a la temperatura, se puede determinar la
capacidad térmica y se demuestra fácilmente que el resultado es

- 31i2V f"'m w4e~"'/kT dw -


Cv- 2n2v~kT2 o (e~"'/kT- 1)2- 9Nk 0
(T)3 fa¡T x4ex dx
o (ex- 1)2.
(6.3-16)

La integral de (6.3-16), que es una función exclusiva de e¡T, se puede evaluar


de un modo númerico dando una función cuya gráfica se ilustra en la figura 6.4.
A altas temperaturas T~ e y el término exponencial de la expresión central de
(6.3-16) se pueden ampliar al igual que se hizo en relación con (6.2-8), obteniéndose
una expresión que se puede integrar fácilmente; a continuación, usando (6.3-10) se
puede demostrar que se obtiene el resultado clásico eV = 3Nk. A bajas temperaturas,

3Nit
v
~------------------

~~0~-----0~5--------~----~15-------2~0 ~8

Figura 6.4. La capacidad térmica de un sólido monoatómico aislador, de acuerdo con la teoría
de Debye, graficada en función de la variable de temperatura reducida T/e.
Teoría de Debye sobre el color específico 191

en la expreswn del lado derecho de ( 6.3-15), el límite de la integral se acerca a


infinito y, por los métodos de integración de contorno, se puede demostrar que la
integral definida resultan te es igual a rr4 115, dando

(au)
oT
=e = 12n Nk(!.)
V Vs e
4 3
(T ~E>). (6.3-17)

Esto se conoce como la "Ley 'J'3 de Debye" y sus predicciones sobre los
calores específicos en la región de temperaturas bajas concuerdan aceptablemente con
los datos experimentales obtenidos con muchas substancias.
El valor de la temperatura de Debye se puede calcular a partir de (6.3-14), u
obtenerse experimentalmente seleccionando el valor de e con el que se obtenga la
mayor concordancia entre los datos experimentales y la expresión teórica (6.3-16).
Los valores calculados y los determinados de un modo experimental están casi siem-
pre de acuerdo en el caso de substancias que obedecen las suposiciones hechas de
acuerdo con la teoría de Debye. Para los elementos metálicos más comunes, la
temperatura de Debye se registra generalmente en el rango de 150-450° K. Seitz 6
presenta una tabla de temperaturas de Debye y un análisis detallado de la concor-
dancia entre los valores de la temperatura de Debye, calculados y determinados de
un modo experimental.
En un cristal, en el que los átomos no son todos idénticos, por ejemplo, el
NaCl, se pueden excitar vibraciones elásticas pertenecientes a modos ópticos o acús-
ticos, y los resultados calculados mediante este procedimiento ya no se pueden
aplicar directamente en los cristales de este tipo. Sin embargo, los modos acústicos y
los ópticos se pueden utilizar por separado. Los modos acústicos se pueden manejar
mediante el procedimiento anterior, mientras que la variación de w con k para los
modos ópticos es, como lo ilustra por ejemplo la figura 3.11, tan pequeña, que gene-
ralmente se obtiene una aproximación bastante buena al considerar los modos óp-
ticos como vibracione3 de una sola frecuencia dada por (3.4-10). Los modos ópti-
cos se pueden tratar mediante el método de Einstein, desarrollado en la sección
anterior y los valores aportados por los modos óptico y acústico se combinan para
dar la capacidad calorífica total del cristal. Blanckman, 7 • 8 estudió con cierto detalle
éstas y otras modificaciones de la teoría primitiva de Debye, y llegó a la conclusión
de que en ciertos casos específicos, el procedimiento de Debye puede llevar a errores
notables y que en tales circunstancias, es mejor usar el procedimiento más exacto de
Born-von Karman.
Se suele pensar que una substancia metálica posee un gran número de elec-
trones libres que pueden servir para producir en el metal un flujo de corriente al
aplicarle un campo eléctrico, lo cual explica la gran conductividad eléctrica de los
metales. Tomando esto como base, se podría esperar que los electrones libres adqui-
rirían una energía cinética adicional cuando el cristal está cerca de una fuente
térmica externa y que debido a ello habría un aumento notable en el calor especí-
fico. En realidad, y contrario a lo esperado, este aumento es tan pequeño que se
puede pasar por alto a temperaturas mayores de aproximadamente 5° K. Por debajo
de esta temperatura, en los cristales metálicos se puede distinguir una variación lineal
del calor específico con respecto a la temperatura, que se debe efectivamente a los
electrones libres. La explicación de este comportamiento peculiar del calor específico
electrónico se dará en el análisis detallado que hace en el capítulo siguiente.

6 F. Seitz, Modern Theory o{ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940),
páginas 110-111.
7 M. B1ackman, Z. Physik 86, 421 (1933).
8 M. Blackman, Proc. Roy. Soc. 148, 384 (1935); 159, 416 (1937).
192 Vibraciones reticulares y propiedades térmicas de los cristales

6.4 EL FONON

Hasta ahora el calor específico de materiales sólidos se ha estudiado en rela-


cwn con osciladores armónicos cuánticos y la energía interna se ha calculado deter-
minando el número de osciladores que hay en promedio en cada estado energético
permisible. Si las vibraciones de la red se pueden tratar de este modo, entonces
deben existir cuantos de energía vibratoria emitidos o absorbidos cuando ocurran
transiciones entre un estado cuántico y otro. Uno de los resultados de la mecánica
cuántica del oscilador armónico es que, a una aproximación de primer orden, las
transiciones ocurren sólo entre estados adyacentes del sistema;9 en otras palabras, en
tales transiciones, el número cuántico del oscilador puede cambiar sólo por ± l. De
acuerdo con esto, el cambio de energía ~E del oscilador correspondiente a la energía
del cuanto que se absorbe o emite, debe ser

~e = ~n · ñw = ± ñw (6.4-1)
en donde w es la frecuencia del oscilador. El signo más de ( 6.4-1) se relaciona con
la absorción y el signo menos con la emisión.
Un cuanto de energía acústica de esta índole se denomina comúnmente fonón,
para guardar cierta analogía con el término fotón usado para un cuanto de energía
electromagnética. Un fonón se parece al fotón en que se debe considerar como algo
que tiene características tanto de onda como de partícula; de hecho, es muy posible
tratar la interacción entre dos fonones o entre un fonón y un electrón, como una
"colisión" de dispersión entre dos partículas. En efecto, el resultado de Debye para
el calor específico se puede obtener considerando las vibraciones reticulares del cris-
tal como un gas de fonones. Puesto que los fonones son partículas no distinguibles,
se debe utilizar la función de distribución Bose-Einstein para describir la distribución
de partículas entre los estados energéticos del sistema y, dado que el número de
fonones del sistema no es constante con respecto a la temperatura, la forma que
toma la función de distribución es (5.6-9), en donde a= O.
El número de fonones en el rango de frecuencias dw, alrededor de w (corres-
pondiente a un rango de energía dE alrededor de E= hw) es, entonces,

N(w) dw = g(w) dw (6.4-2)


ehw/kT _ 1

en donde g( w) dw es el núm~:ro de vibraciones normales posibles del sistema dentro


del rango dw alrededor de w. No obstante, en (6.3-2) y (6.3-7), ya se sabe que

dk 3k 2 V dk
g(w) dw = g(k) -d dw = -.-
2 -d dw. (6.4-3)
w 2n w

Utilizando la aproximación de De by e ( 6.3-8) para expresar k y dk/dw en


función de w (6.4-2) se convierte en

3V w 2 dw
N(w) dw = -----z-3 hwfkT • (6.4-4)
2n v0 e - 1

9 Para una derivación de esta regla de selección véase R. B. Leighton, Principies of Modem
Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), páginas 211-222.
Expansión térmica de los sólidos 193

El aumento de la energía interna correspondiente al rango de frecuencias dw


alrededor de w es, simplemente, la energía cuántica hw multiplicada por el número
de cuantos que haya en ese rango de frecuencias. Por tanto,

dU = e(w)N(w) dw = hwN(w) dw

3/iV w 3 dw
= 21t2V~ eAw/kT _ 1· (6.4-5)

Al integrar sobre todas las frecuencias permisibles desde cero hasta la frecuen-
cia máxima de Debye Wm, se obtiene directamente el resultado (6.3-11). Por supues-
to, el término de energía de punto cero no se obtiene cuando la energía interna se
calcula en esta forma, ya que la energía de punto cero no está relacionada de
ningún modo con la distribución de los fonones. Sin embargo, este término no
modifica el calor específico y los dos métodos conducen al mismo valor (6.3-16) del
calor específico; dicho resultado es de interés físico y accesible a la medición. En
consecuencia, el sistema se puede tratar como un conjunto de osciladores armónicos
distinguibles que obedecen a la estadística de Maxwell-Boltzmann o bien, como un
gas de fonones o cuantos de energía vibratoria, que no son distinguibles, y que
obedecen a la estadística de Base-Einstein.

6.5 EXPANSI ON TERMICA DE LOS SOLIDOS

La representación de un sólido como sistema de átomos que tienen la libertad


para vibrar alrededor de un arreglo periódico de posiciones de equilibrio, desarrollado
en las secciones anteriores, basta para explicar el comportamiento observado del
calor específico y, también, es suficiente para entender la expansión térmica de los
sólidos. No obstante, en este caso se encuentra que si los átomos del cristal son
simples osciladores armónicos ideales, no puede haber una expansión térmica en
absoluto, de acuerdo con el pensamiento de la mecánica clásica ni la cuántica, y que
el efecto total de la expansión térmica de un cristal real depende de la inarmonía de
las vibraciones de la red.
Este resultado se puede comprender cualitativamente considerando la energía
potencial de interacción entre átomos cercanos, que debe tener la forma de una
función de la distancia interatómica, como se ilustra en la figura 6.5. El mínimo en
la curva de energía potencial, en B, es la posición clásica de equilibrio del átomo en
cuestión cuando está en reposo. Si las fuerzas interatómicas fueran tales que el áto-
mo al activarlo por excitación térmica vibrará alrededor de su posición de equi-
librio, como un oscilador armónico clásico ideal, entonces la curva potencial sería una
parábola perfecta cuyo vértice se ubicaría en B. En un ''pozo'' de potencial de esta
naturaleza, el átomo ejecutaría vibraciones armónicas alrededor del punto de equi-
librio B, las excursiones máximas a partir de dicho punto de equilibrio en ambas
direcciones serían iguales, y la distancia interatómica promedio (x} sería igual a la
.::onstante de red a temperatura cero, a. Así pues, no habría ninguna expansión
térmica en absoluto.
Sin embargo, en realidad, el cristal se desintegra al aplicarle una cantidad finita
de energía y, por tanto, el pozo potencial en el que vibran los átomos debe tener
.1proximadamente la apariencia que se ilustra en la figura 6.5. En este caso, aunque
es casi parabólico alrededor del punto mínimo B, el verdadero pozo se desvía cada
194 Vibraciones reticulares y propiedades térmicas de los cristales

t•

1-- Pozo P.arabólico que corresponde


¡ al OSCilador ideal armónico

~O~l¡---:~----t-----=:==~~~==~--- X
Energfa potencial del átomo

Niveles cuanticos permitidos


del oscilador inarmónico

Figura 6.5. Representación de la energía potencial de un solo atomo del cristal en tunción del
espaciamiento interatómico, ilustrando el papel de la componente inarmónica en la
expansión térmica.

vez más de la forma parabólica conforme aumenta 1a distancia que lo separa del
punto mínimo. Si el átomo tiene una energía e0 , como debe ser, de acuerdo con el
cuadro clásico, deberá vibrar entre los límites de amplitud extrema A y C, siendo las
vibraciones de naturaleza más bien inarmónica. No obstante, la distancia DC entre la
posición de equilibrio y la posición de máxima extensión es ahora mayor que la
distancia AD entre la postción de equilibrio y la posición de máxima compresión.
La distancia interatómica promedio <x> es, por tanto, mayor que la constante de red
a temperatura cero y se observa una expansión térmica. Se puede demostrar que esta
observación clásica del efecto lleva a la conclusión de que la expansión térmica
<x>- a es directamente proporcional a la temperatura o que el coeficiente de expan-
sión térmica d(<x>- a)/dT es independiente de la temperatura. Esto concuerda bas-
tante bien con lo observado en la mayoría de las substancias, en el rango de
temperatura ambiente o un poco por encima de ella.
No obstante, a temperaturas bajas, el coeficiente de expansión térmica obser-
vado en la mayoría de los materiales se hace mucho más pequeño que el valor
clásico y, en efecto, tiende a cero conforme la temperatura absoluta se acerca a
cero. También aquí la representación clásica se hace inaplicable y los átomos del
cristal deben considerarse como osciladores cuánticos y no como clásicos. Para calcu-
lar la expansión térmica, primero se debe resolver la ecuación de Schrodinger utili-
zando un potencial inarmónico (por lo general basta con modificar el potencial
armónico (4.12-6) mediante la adición de un término cúbico en x) para obtener los
niveles energéticos En y las funciones de onda correspondientes a este potencial
modificado y, a continuación, se debe encontrar el valor esperado <x>n para cada
estado energético permisible según (4.8-11). Entonces, la distancia interatómica, pro-
mediada sobre una distribución de Maxwell-Boltzmann, debe escribirse (en analogía
con (6.2-1)) como
L (x).e-•nlkT
(6.5-1)
(x) = • Le tn/kT


Conductividad térmica reticular de los sólidos 195

en donde la suma se toma sobre todos los niveles de un oscilador inarmónico. Los
detalles de este procedimiento son muy complejos y no se presentarán aquí. El
coeficiente de expansión térmica calculado mediante este método se acerca a cero y
concuerda aceptablemente con los experimentos sobre un amplio rango de tempe-
raturas.

6.6 CONDUCTIVIDAD TERMICA RETICULAR DE LOS SOLIDOS

La conducción de calor en los sólidos es un proceso en el que las vibraciones


de red desempeñan también un papel importante. En los cristales metálicos en los
que se tienen grandes concentraciones de electrones libres, éstos hacen aumentar
notablemente la conductividad térmica y, en efecto, constituyen el mecanismo prin-
cipal para el transporte de energía térmica a través del cristal. El estudio de la
conductividad térmica electrónica en los metales se facilita realizándolo a la luz de la
teoría del electrón libre de los metales y, por tanto, se pospondrá hasta un capítulo
posterior. Sin embargo, en substancias no metálicas, el transporte de calor a través del
cristal se debe exclusivamente a las vibraciones de la red.
La conductividad térmica se define generalmente como una situación de flujo
térmico unidimensional, en la que hay una diferencia de temperatura t:1l' sobre una
distancia &, originando un flujo de calor /Y), en una superficie A dentro de un
tiempo !:J.t. La conductividad térmica es el coeficiente de proporcionalidad entre el
flujo de calor por unidad de área y el gradiente de temperatura. De acuerdo con
esta definición, se puede escribir

1 AQ AT
J =--=-K- (6.6-1)
qx A At Ax'

en donde K es el coeficiente de conductividad térmica y Jqx el flujo de calor por


unidad de área o la densidad de corriente térmica. El signo menos es obligatorio, ya
que K se considera como una cantidad positiva; pues, con un gradiente de tempe-
ratura positivo se obtendría una corriente térmica negativa. Si se conserva la energía
térmica, la corriente térmica debe obedecer siempre a la ecuación de continuidad de
la forma

V·J
q
=oTq" aQ
ax- = - -ot. (6.6-2)

Si se combinan (6.6-2) y (6.6-l), se puede ver fácilmente que la temperatura


(y, por ende, la energía térmica por átomo) debe obedecer a una ecuación dife-
rencial de la forma

K o2 T oT
~ ox 2 =a¡· (6.6-3)

. Esta ecuación diferencial parcial es esencialmente la misma que la ecuación que


de~cnbe el tra~sporte por difusión de partículas móviles en un medio en el que
ex1~te .un gradiente de concentración. Difiere de la ecuación para la propagación
radiactiva (3.1-12) en que el lado derecho es la primera derivada con respecto al
tiempo Y no la segunda derivada. Sus soluciones características tienen un comporta-
196 Vibraciones reticulares y propiedades térmicos de los cristales

miento exponencial en lugar de armónico con respecto al tiempo, como se verá más
adelante en un capítulo posterior.
En un sistema compuesto de osciladores armónicos ideales, los diversos modos
normales de oscilación del sistema son completamente independientes los unos de
otros, no existiendo en absoluto ningún acoplamiento entre los diferentes modos
normales de vibración. Si se excita un modo normal dado de dicho sistema, éste
vibrará en forma estable en ese mismo modo normal durante un periodo indefinido.
En un sistema de este tipo, la energía de vibración se propaga directamente por
radiación acústica en lugar de hacerlo por un proceso mucho más lento que se
asocia con la conducción térmica. Así pues, la energía fluye a través del sistema con
la velocidad del sonido, y no existe un mecanismo mediante el cual se pueda hacer
aleatoria esta energía y mediante el cual se crea una resistencia térmica, de modo
que la conductividad térmica del espécimen es esencialmente infinita. Estas observa-
ciones son aplicables a los osciladores cuánticos al igual que a los osciladores clá-
sicos. Este estado de cosas se puede describir en función de los fonones mediante la
proposición de que los fonones correspondientes a diferentes vibraciones armónicas
de modo normal no interactúan entre sí en absoluto -o que su sección transversal
de interacciones mutuas es cero.
Si se introduce una pequeña inarmonía en dicho sistema, se produce un aco-
plamiento entre los diversos modos normales. En este caso, si en un principio se
excita un solo modo normal, la energía que inicialmente pertenece a este modo se
transferirá gradualmente a otros modos normales que pueda tener el sistema y, así.
quedará aleatorizada. En el lenguaje de los fonones, se puede decir que los fonones
que representan las diferentes vibraciones de modo normal del sistema, interactúan
(o chocan) unos con otros. En otras palabras, un grupo de fonones correspondientes
a un solo modo normal del sistema armónico interactúan (o dispersarán unos a
otros) de tal forma que, después de cierto tiempo, las cantidades de movimiento de
cada fonón y sus direcciones de propagación cambiarán de una manera esencialmente
aleatoria. La distribución de los fonones se convierte así, en una distribución que
representa una selección más o menos aleatoria de los modos normales del sistema.
dentro de las restricciones impuestas por la conservación de energía y la cantidad de
movimiento en las interacciones individuales.
De acuerdo con esto, es evidente que la conductividad térmica sería infinita.
de no ser por la inarmonía de las vibraciones de red. La fuerza de la componente
de inarmonía del potencial interatómico es, por tanto, un factor primordial en la
determinación de la conductividad térmica. Puesto que la magnitud de la inarmonía
aumenta de acuerdo con la amplitud de vibración, es de esperarse que la conducti-
vidad térmica disminuya conforme se incrementa esta amplitud, llegando a una re-
ducción de la conductividad térmica de la red al aumentar la temperatura. Este
efecto se observa de un modo muy general en los experimentos efectuados a tempe-
raturas lo suficientemente elevadas. Una medición inversa de la fuerza de la interac-
ción inarmónica entre los átomos de cristal, está dada por la distancia promedio que
un fonón puede recorrer entre las colisiones aleatorizadoras o fenómenos de disper-
sión en que intervienen otros fonones. Esta distancia se conoce como la trayectoria
libre media para las interacciones fonón-fonón y la conductividad térmica de los
sólidos se puede entender con mayor facilidad sobre una base cualitativa en términos
de la trayectoria libre media. En secciones posteriores se tendrá la ocasión de anali-
zar la trayectoria libre media de un modo más preciso y en una forma cuantitativa.
La conductividad térmica de los sólidos se comprenderá con mayor claridad
considerando al cristal como un recipiente que encierra un "gas" de fonones. Pri-
mero se desarrollará una fórmula para la conductividad térmica de un gas monoató-
mico ideal y luego se examinará cómo se puede aplicar a la red de un sólido
cristalino En primer lugar, se debe definir el número de partículas de un gas ideal
Conductividad térmica reticular de los sólidos 197

que tienen una velocidad en el rango de dv alrededor de v, que cruzan un elemento


de área dS por unidad de tiempo, desde una dirección que queda dentro del rango
angular d(J alrededor del ángulo polar fJ. Esta cantidad es la mitad del número
dentro del rango de velocidad en el interior de una columna cuya sección transversal
es dS cos (J (que es la proyección del área dS sobre un plano normal a la dirección
fJ) que queda a una distancia de v centímetros del elemento de área propiamente
dicho. Esta situación se ilustra en la figura 6.6. El factor un medio se incluye
porque, en promedio, sólo la mitad de las partículas dentro de la columna que va a
lo largo de la dirección (J, están encaminadas hacia el elemento de área, y el resto
va en dirección opuesta. Si n(v) dv es el número de partículas por unidad de volumen
que tienen la velocidad dentro del rango v alrededor de v, entonces, el número que
cruza el elemento de área es

4n sen 9 d(J
dn = fv · n(v) dv · 41t • dS cos 9 = fvn(v) sen(} cos (} dv d(J dS. (6.6-4)

El factor asociado con sen (J anterior representa la relación del ángulo sólido
subtendido por d(J alrededor de O y e1 ángulo sólido 41T subtendido por todo el
espacio; es evidente que ese factor debe aparecer también en la expresión. Si se
integra sobre v utilizando la distribución Maxwell-Boltzmann (5.4-14) (y recordando
que la distribución de velocidad es independiente de fJ), se obtiene

n(9) d(J = fnc sen 9 cos (} d(J dS (6.6-5)

con e dadapor (5.4-20), como el resultado deseado.


En este punto conviene hacer notar que el problema de la conducción térmica
siempre implica un flujo de energía y un gradiente de temperatura, es decir que el
sistema en cuestión nunca se encuentra en un estado de equilibrio térmico. Por esta
razón, no es estrictamente correcto utilizar las funciones de distribución estadística
que se aplican a sistemas en equilibrio. Sin embargo, si el gradiente de temperatura
del sistema es tan pequeño que la variación fracciona! de la temperatura absoluta
sobre una trayectoria libre media es reducida, se justifica el uso de la distribución en
equilibrio como una aproximación. En todo caso, el problema se limitará aquí al
estudio de sistemas de esta naturaleza. La cuestión del uso de distribuciones esta-
dísticas en sistemas que no están en equilibrio, se examina en el siguiente capítulo.

FJgUra 6.6. Geometría de partículas que fluyen a través de un plano, usadas en el cálculo de la
sección 6.6.
198 Vibraciones reticulores y propiedades térmicas de los cristales

Por lo pronto, considérese la situación Ilustrada en la figura 6. 7. Se supone


que existe un gradiente de temperatura a lo largo del eje x, de tal manera que las
partículas en el origen tienen una energía promedio e y las que se encuentran a una
corta distancia hacia la izquierda tienen la energía promedio e+ &. Supóngase que
una partícula principia a una distancia 1 del origen y cede su energía a la distribu·
ción en el origen, en una colisión que se produce en ese lugar. De acuerdo con la
expansión de Taylor, la energía de esta partícula es

(6.6-6)

Por supuesto, para esta partícula se tendrá otra que va en dirección opuesta y
que transporta e energía desde el origen hasta el punto inicial de la primera par-
tícula. El transporte neto de energía es & = (1 cose) (3ef3x ), y, puesto que el valor
promedio de 1 es simplemente la trayectoria libre media entre las colisiones aleato-
rias, que se denominará X, el transporte neto de energía por partícula, promediada
sobre la distribución de las longitudes de trayectoria 1, es

oe
e = (A. cos 8) ox. (6.6-7)

Para partículas con un ángulo polar e, de acuerdo con ( 6.6-5) y ( 6.6-7), se


produce un flujo neto de energía !lF por unidad de área, en donde

!l.e · n(O) dO 1 oe
!l.F = = - ncA.- cos 2 Osen O dO (6.6-8)
dS 2 ox .
Al integrar sobre el ángulo polar e entre los límites de O y 1r se puede ver
fácilmente que el flujo total de energía debe ser -tncX (3e/3x). No obstante, de
acuerdo con la definición de la conductividad térmica, K (6.6-l), esto debe ser igual
también a K (3Tj3x). De acuerdo con esto,

oT 1 oe 1 oe oT
K - =-nCA.- =-nCA.- - , (6.6-9)
ax 3 ax 3 ar ax

• +Ó• •

Figura 6.7. Trayectoria de una partícula en un sistema que contiene un gradiente de tempe-
ratura en la dirección x.
Conductividad térmica reticular de los sólidos 199

por lo cual,

1 ae 1
K = -3 ncA. -ar = -3 euA.c• (6.6-10)

de donde, por definición, el calor específico cv es n(oe/31).


Este resultado, que se acaba de derivar para un gas ideal de Maxwell-Boltz-
mann, es aplicable también a una distribución de fonones, a condición de que se
sobreentienda que la velocidad e se refiere a una velocidad promedio de fonón, esto
es, a una velocidad promedio de sonido dentro del cristal. [Se recordará que la
distribución de Boltzmann se utilizó sólo para velocidades promedio al obtener
(6.6-5).] Entonces, de acuerdo con (6.6-10), el problema de determinar la conducti-
vidad térmica de red se puede reducir esencialmente a la determinación de la trayec-
toria libre media de los fonones en el cristal, ya que la velocidad del sonido y el
calor específico se pueden medir o calcular con facilidad. Desgraciadamente este
problema no es tan sencillo. Reproducir el trabajo comprendido en su cálculo queda
más allá del alcance de este libro. Peierls,l 0 fue el primero en resolver este pro-
blema, y encontró que X es proporcional a 1/T a temperaturas elevadas y a eE>/lT a
temperaturas bajas. De acuerdo con esto, la conductividad térmica se deberá hacer
infmitamente grande conforme la temperatura se acerca al cero absoluto, ya que el
producto de Cv y X divergirá al infmito en este límite. Sin embargo, en realidad, a
temperaturas muy bajas la trayectoria libre del fonón deja de estar limitada por las
interacciones fonón-fonón y se ve limitada, por el contrario, por la dispersión de
fonones mediante impurezas e imperfecciones en el cristal o bien, en cristales muy
puros, por las superficies de la misma muestra de cristal. ¡En este último caso, se ha
encontrado que la conductividad térmica del cristal es una función del tamaño de la
muestra! En cualquier caso, la trayectoria libre media tiende a un límite finito
conforme T se acerca a cero, y la conductividad se acerca a cero conforme T tiende
a cero, debido al hecho de que Cv se desvanece en el límite de la temperatura cero.
Entonces, al incrementarse la temperatura la conductividad térmica aumenta de cero
a cierto valor máximo y luego disminuye conforme la temperatura se incrementa
más todavía. Este comportamiento cualitativo se ha observado, efectivamente, de un
modo experimental en la mayoría de los casos y las magnitudes de los valores
calculados ( 6.6-1 O) a partir de los valores calculados de X, concuerdan con los datos
experimentales en el orden de magnitud. Casimir 11 fue el primero en estudiar el
efecto de la dispersación a través de las fronteras del cristal, y Klemens 12 fue quien
trató detalladamente el efecto de ciertos tipos de imperfecciones.

EJERCICIOS

l. Demuestre de un modo explícito, utilizando la estadística de Maxweli-Boltzmann, que la


energía promedio de un oscilador armónico clásico tridimensional es sencillamente tres veces la
de un oscilador armónico clási.::o unidimensional a la misma temperatura y que, por tanto, no
unporta si el cristal de N átomos se considera como un conjunto de N osciladores tridimensio-
nales o bien, como 3N osciladores unidimensionales.
2. Calcule, por el método de Debye, la capacidad calorífica de una red cristalina periódica
bidimensional que contiene N átomos idénticos, y demuestre que a temperaturas bajas, la capaci-
dad calorífica varía con la temperatura como 'J'2. ¿Cuál es el límite en alta temperatura para la
capacidad térmica?

lO R. Peierls, Ann. Physik 3, 1055 (1929).


11 H. B. G. Casimir, Physica 5, 495 (1938).
12 P. G. Klemens, Proc. Roy. Soc. A208, 108 (1951).
200 Vibraciones reticulares y propiedades térmicas de los cristales

3. Calcule la temperatura de Debye 8 para (a) diamante, (b) germanio, (e) cobre y
(d) plomo, y compare sus resultados con Jos valores publicados derivados de los datos experi-
mentales de la capacidad térmica.
4. Utilice la relación de Planck para expresar la energía de un fonón en relación con su
frecuencia y la relación de De Broglie para expresar la cantidad de movimiento en función del
número de onda; encuentre una expresión para la "masa" equivalente de un fonón de energía
térmica promedio a 300° K, y compare este valor con la masa electrónica. Puede suponer que k
es tan pequeña que se puede hacer caso omiso de Jos efectos de dispersión.
S. Demuestre que el valor promedio <x>n de la amplitud de un oscilador armónico cuán-
tico, en el nésimo estado de energía, es cero.
6. Utilice las leyes de la termodinámica para demostrar que la difer~::ncia entre el calor
específico de una substancia a presión constante y a volumen constante está dada por

9oc 2 VT
Cp-Cu = - - -
K~oo

en donde a es el coeficiente lineal de expansión y Kiso es la compresibilidad isotérmica - V-1


(iW/aP>r· Nota: Observe que, de acuerdo con las relaciones de Maxwell (os/aP)r=-(av¡aT)p.
7. Sea un conjunto de N sistemas idénticos que tienen sólo dos niveles de energía, a las
energías cero y € 0 . Suponiendo que los sistemas son distinguibles, encuentre (a) la energía
interna del conjunto, (b) la capacidad térmica, (e) las expresiones aproximadas para la capacidad
térmica en los límites de temperatura alta y baja. Grafique la capacidad térmica en función de la
temperatura.
8. Para el conjunto de sistemas que se vio en relación con el ejercicio 7, demuestre que la
capacidad térmica alcanza un valor máximo a una tt.>mperatura T 0 para la que

xtanhx=l
en donde x =e0 /2kT. Demuestre también que la capacidad térmica a esta temperatura está dada
por

c. (max) = Nk (x~ - 1)

en donde X o = e0 /2kT0 • Las contribuciones a la capacidad térmica de sistemas de esta natura-


leza, se encuentran con frecuencia a temperaturas bajas en substancias paramagnéticas y se cono-
cen también con el nombre de anomalías de Schottky.
9. De acuerdo con la expresión de la mecánicd cuántica e=<1 +nx +ny +nz)hvo (en
donde nx, nY. y nz pueden ser cero o enteros positivos) para los niveles de energía de un
oscilador armónico tridimensional, demuestre, en el límite de las energías grandes en donde
e>% y de:lil>%, que el número de estados cuánticos dentro de un rango de alrededor de la
energía e, está dado por g(e) de= e2de/2(flwo) 3 •
10. Utilice el resultado del problema 9 para demostrar que la expresión (e)= 3kT para la
energía promedio de un oscilador armónico clásico tridimensional de un sistema cuyos miembros
están distribuidos en energía de acuerdo con la ley de Boltzmann, se puede obtener sencilla-
mente evaluando la expresión

fef(e)g(e) de
(e) =
Jt(e)g(e) de

Compare críticamente los aspectos físicos de este método y el que se utilizó para obtener el
mismo resultado en la sección 6.1.

REFERENCIAS GENERALES
P. G. Klemt'ns, Thermal Conductivity and Lattice Vibrational Modes, en Salid State Physics,
Advances in Research and Applications, Vol. 7, Academic Press, Nueva York (1959), pp.
l-98.
Conductividad térmica reticular de los sólidos 201

1. de Lannay, The Theory of Specific Heats and Lattice Vibrations, en Salid State Physics,
Advances in Research and Applications, Vol. 2, Academic Press, Nueva York (1956), pp.
219-303.
LB. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959),
capítulo 6.
1l. B. Peierls, Quantum Theory o[ Solids, Clarendon Press, Oxford (1955), capítulo 11.
f Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo Ill.
CAPITULO 7
Teoría del electrón
libre de los metales

7.1 INTRODUCCION

En 1900, Drude 1 fue el primero en formular la hipótesis de que la gran


conductividad eléctrica y térmica de las substancias metálicas podría explicarse de-
bido a la presencia de grandes concentraciones de electrones libres móviles en estos
materiales. Más tarde, Lorentz 2 investigó exhaustivamente las implicaciones de esta
idea. Drude y Lorentz supusieron que los electrones libres de un metal podían
considerarse como un gas ideal de partículas libres, el cual obedece a la estadística
de Maxwell-Boltzmann, cuando se encuentra en equilibrio térmico. Para examinar lo
que puede suceder cuando se permite el flujo de corrientes eléctricas o térmicas,
estableciéndose así un estado de desequilibrio, fue necesario investigar cómo se modi-
ficaría la distribución de equilibrio mediante una (pequeña) corriente eléctrica o
térmica. También fue necesario estudiar el comportamiento cinético de los electrones
como el de partículas libres sujetas a colisiones instantáneas que sirven para volver la
distribución a una condición de equilibrio, y para expresar el resultado final de la
conductividad eléctrica y térmica en términos de una trayectoria libre media o tiem-
po libre medio entre estos choques aleatorios. La teoría Drude-Lorentz explicó satis-
factoriamente la ley experimental bien conocida de Wiedemann y Franz, 3 según la
cual la relación existente de la conductividad eléctrica a la térmica es casi la misma
para la mayoría de los metales. Además, para calcular las magnitudes de la conduc-
tividad eléctrica y térmica se podrían utilizar los valores más elevados para la trayec-
toria libre media.
Sin embargo, la teoría del electrón libre en su forma más sencilla llevó a una
predicción de la componente electrónica del calor específico que (suponiendo que la
teoría de Debye para el componente reticular esté en lo correcto) estaba en gran
desacuerdo con los resultados experimentales. Sommerfeld4 resolvió esta dificultad
Uunto con algunas otras) utilizando la estadística de Fermi-Dirac en lugar de emplear
la estadística clásica de Boltzmann. La representación del electrón libre empleando la
estadística de Fermi-Dirac constituye una forma teórica muy directa y sencilla de
analizar y entrever los efectos de transporte en los metales. Puesto que principia con
una idea preconcebida del aspecto de un metal, no tiene ningún valor para explicar

1 P. Drude, Ann. Physik 1, 566 (1900).


2 H. A. Lorentz, The Theory of Electrons, Teubner Verlag, Leipzig (1909).
3 Wiedemann y Franz, Ann. Physik 89, 497 (1853).
4 A. SommerfeJd, Z. Physik, 47, 1 (1928).

203
204 Teoría del electrón libre de los metales

por qué algunas substancias son metales y tienen electrones libres en abundancia y
otros son aisladores con sólo unos cuantos electrones libres, si es que los tienen.
Para encontrar una explicación a estas cuestiones fundamentales, es necesario comen-
zar examinando el comportamiento mecánico cuántico de los electrones en los cam-
pos periódicos de potencial, examinando el mismo tema en un nivel mucho más
fundamental. El último planteamiento se pospondrá hasta el siguiente capítulo, en el
que se demostrará que las propiedades de los metales y los aisladores se pueden
comprender de acuerdo con la teoría cuántica, y que las bases en las que descansa
la teoría del electrón libre son, en su mayor parte, compatibles con los requisitos de
la mecánica cuántica.

7.2 LA ECUACION DE BOLTZMANN Y LA TRAYECTORIA


LIBRE MEDIA

En cualquier problema de mecánica estadística, lo más importante es conocer


la forma de la función de distribución. Por supuesto, en un sistema de equilibrio
térmico, la función de distribución será una de las que ya se estudiaron en el
capítulo 5, pero si el estado del sistema no es de equilibrio (por ejemplo, si fluye
una corriente o hay un gradiente de temperatura), la función de distribución será
algo distinta. Naturalmente, en el límite en que desaparece la perturbación de la
condición de equilibrio, la función de distribución de desequilibrio debe aproximarse
a la distribución de equilibrio apropiada. Entonces, para cualquier estudio estadístico
de procesos en desequilibrio debe darse un paso preliminar que consiste en la deter-
minación de una forma para evaluar la función de distribución cuando el sistema se
encuentra en un estado de desequilibrio. Esto se logra mediante la ecuación de
Boltzmann.
Para deducir esta ecuación, debe considerarse una región de espacio de fase
alrededor del punto (x,y,z,px,Py.Pz). El número de partículas que entra en esta
región en el tiempo dt, es igual al número de las que estaban en la región del
espacio de fase en (x- Vxdt, y - Vydt, z - Vzdt, Px - Fxdt, Py - Fydt, Pz - Fzdt) en
un tiempo anterior dt. En este caso, F representa la fuerza que actúa sobre las
partículas de la distribución en el punto (x, y, z) y el tiempo t, y se sigue de la ley
de Newton, F = dpfdt. Si f(x, y, z, Px• Pv• Pz) es la función de distribución que ex-
presa el número de partículas por estado cuántico en la región, entonces, habrá un
cambio df que ocurre durante el tiempo dt, debido al movimiento de las partículas
en el espacio de las coordenadas y debido a que los campos de fuerza que actúan
sobre las partículas tienden a moverlas de una región a otra en el espacio de la
cantidad de movimiento; este cambio df es

df = f(x- v"dt, y- v,dt, z - v.dt, Px- F"dt, p1 - F,dt, Pz- F.dt)


- f(x,y,z,p",p,,p.). (7.2-1)

Utilizando la expansión de Taylor y manteniendo sólo los términos de primer


orden dentro del límite dt ~O, esta expresión se puede escribir como sigue
La ecuación de Boltzmann y la trayectoria libre media 205

o bien,

df
-
dt
= -v · vr-
J
F ·V f
p '
(7.2-2)

en donde el símbolo VP se refiere al operador del gradiente en el espacio de canti-


dad de movimiento (px, Py. Pz). Hasta ahora sólo se ha explicado el cambio en la
función de distribución debido al movimiento de las partículas en el espacio de las
coordenadas y debido a los cambios en la cantidad de movimiento originados por los
campos de fuerza que actúan sobre las partículas. Las partículas también se pueden
~ransferir hacia dentro o hacia afuera de una región dada del espacio de fase, por
medio de colisiones o interacciones de dispersión que abarcan otras partículas de la
distribución o centros de dispersión externos al conjunto de partículas que se están
estudiando. Si la velocidad de cambio de la función de distribución debida a las
colisiones o a la dispersión se representa mediante (a¡;at) col• entonces, la velocidad
total de cambio de f se puede obtener sumando esta cantidad al lado derecho de
(7.2-2), lo cual da

# = -v•Vf-F·VPJ+
- (~)
- (7.2-3)
dt at col

Esta es la ecuacton de Boltzmann. Si se conoce el campo de fuerza F y la


velocidad de cambio (a¡;at) col• de la ecuación diferencial (7.2-3), en principio, se
puede despejar la función de distribución.
Por supuesto, a fin de hacer esto se debe adoptar para la interacción de
dispersión algún modelo que pueda proporcionar la velocidad a la que las partículas
a consecuencia de colisiones pueden entrar en cualquier región dentro del espacio de
fase a salir de ella. Por ejemplo, se pueden suponer condiciones de estado estacio-
nario que indican que df/dt =O, y, además, especificar que no existen campos de
fuerza que actúen sobre las partícula~ y que las partículas de la distribución son
esferas duras, perfectamente elásticas y de un radio dado, que sufren colisiones que
pueden tratarse mecánicamente de acuerdo con las leyes clásicas del movimiento,
para obtener un valor promedio para (a¡;at) col· Este cálculo mecánico proporciona
fundamentalmente una sección transversal de la dispersión de una partícula de la
distribución. En este caso, se puede demostrar que la ecuación de Boltzmann lleva
directamente a la distribución Maxwell-Boltzmann del capítulo 5.
La ecuación de Boltzmann se usa más comúnmente para analizar las propie·
dades de un sistema que se encuentra desplazado del estado de equilibrio debido a
una fuerza perturbadora pequeña -por ejemplo, un campo eléctrico o un gradiente
de temperatura- cuando se conoce la función de distribución / 0 , que es la función
de distribución en equilibrio, cuando no hay perturbación. En estos casos, con fre-
cuencia se supone que el término de la colisión tiene la forma

(-a¡) -_-f-- -Jo


at col T
(7.2-4)

en donde T es un parámetro denominado tiempo de relajación o tiempo libre medio.


L~ ecuación (7.2-4) representa la velocidad a la que la función de distribución se
acerca a la condición de equilibrio (habiéndose eliminado repentinamente la fuerza
de perturbación), siendo proporcional en cualquier tiempo a la desviación, desde el
equilibrio.
206 Teoría del electrón libre de los metales

Por ejemplo, suponga que un campo eléctrico E0 ongma una corriente en un


circuito que se compone de una substancia metálica uniforme, de tal modo que f es
la misma en todos los puntos y, por ende, Vf = O. Mientras el campo se aplica, la
fuerza F de (7.2-3) debe representarse como -eE0 ; pero si el campo se suprime de
un modo repentino, por ejemplo, cuando t =O, entonces, para valores positivos de t,
F = O, y la ecuación de Boltzmann, utilizando la aproximación del tiempo de relaja-
ción (7.2-4), se convierte en

=---
f-fo (t >O) (7.2-5)

que se puede resolver fácilmente y se obtiene

f- fo = (const.)e-'1' (t > 0). (7.2-6)

Así es como la función de distribución se aproxima exponencialmente junto


con la constante de tiempo 7, a la función de distribución en equilibrio y se descubrirá
que la corriente del circuito disminuye de su valor inicial esencialmente en la misma for-
ma, tendiendo a cero exponencialmente con la constante de tiempo 7.
A primera vista, este resultado parece contradecir la evidencia experimental;
pero en realidad no se opone a ella, ya que la constante de decaimiento 7 en
circunstancias ordinarias, es muy corta, casi siempre del orden de 1o- 13 segundos.
Un estudio más cuidadoso puede ayudar a verificar la factibilidad de (7.2-6), ya que
la acción del campo eléctrico es darle a los electrones del circuito una velocidad de
arrastre en dirección opuesta a la corriente que, de acuerdo con la ley de la inercia,
debe persistir durante un corto tiempo después de la supresión de la fuerza, hasta
que los electrones del conductor pasen los procesos que aleatorizan su velocidad
reduciendo la velocidad promedio de arrastre a cero. Es evidente que las colisiones
ejercen influencia en una distribución que es perturbada de un modo u otro, pero
tiende a restaurarse al estadd de equilibrio y, si dicha perturbación se suprime, esta
restauración se logra en un tiempo del orden del tiempo de relajación 7. Los detalles del
proceso de dispersión determinan el tiempo de relajación que, en general, es una fun-
ción de la energía, debido a que la sección transversal de la dispe1sión puede depender
de la energía.
Este efecto de restricción de las colisiones es esencial para determinar la ley
que relaciona la densidad de corriente con el campo eléctrico en un conductor
ordinario. Si un sistema que contiene electrones perfectamente libres recibe la in-
fluencia de un campo eléctrico constante, sin que hayan colisiones, los electrones
sometidos a una fuerza constante adquieren una aceleración constante y, por tanto,
una velocidad linealmente creciente. Por consiguiente con un campo dado, la den-
sidad de corriente en un conductor largo sería mayor que en uno corto, ya que la
velocidad promedio de los electrones principiando en repo'so en un extremo y flu-
yendo hacia el otro, sería mayor en la trayectoria más prolongada que en la más
corta. Por supuesto, esto no es lo que sucede en absoluto. En realidad, un electrón
que principia en reposo es acelerado por un campo y adquiere una velocidad de
arrastre que aumenta linealmente durante un corto tiempo; pero a continuación sufre
una colisión que (en promedio) reduce su velocidad de arrastre a cero y el proceso
se repite. Durante un periodo dado, al electrón puede asignársele una velocidad de
a"astre constante promedio, proporcional al campo e inversamente proporcional al
tiempo de relajación. Esto lleva a la ley de Ohm, según la cual la densidad de
corriente es proporcional a la fuerza del campo eléctrico. Se puede hacer una esti-
mación aproximada de la conductividad basándose en esos datos. La fuerza ejercida
La ecuación de Boltzmann y la trayectoria libre media 207

sobre un electrón es -eE0 , en donde E 0 es el campo aplicado, por lo que la


aceleración es -eE0 /m, siendo m la masa del electrón. Si la fuerza actúa durante el
tiempo t, produce una velocidad de arrastre -eE0 t/m y si el tiempo promedio que
hay entre las colisiones aleatorias es 7, la velocidad de arrastre promedio está dada
por

_ eE0 r:
V=---, (7.2-7)
2m

suponiendo, por supuesto, que la velocidad de arrastre se ha reducido a cero en


promedio de bido a una colisión. Si la densidad de electrones libres es n 0 , la den-
sidad de corriente I será, por definición,

(7.2-8)

en donde la conductividad se expresa mediante

(7.2-9)

La ecuación (7.2-8) es, sencillamente, la ley de Ohm; este simple planteamiento en


el que se hace caso omiso de los promedios, da un valor de 7 demasiado pequeño al
multiplicarlo por 2, como se verá en breve.
El hecho de considerar el tiempo de relajación 7 como el tiempo libre medio
entre las colisiones aleatorias, se puede explicar si se analiza un grupo compuesto
inicialmente de n 0 partículas, en el tiempo t = O, cada una de las cuales puede sufrir
una colisión que aleatoriza por completo su velocidad con una probabilidad dt/7 en
cualquier intervalo de tiempo dt. Suponga que en el tiempo t, quedan n(t) partículas
que todavía no han tenido un choque. El número de partículas que chocan en un
tiempo dt, con respecto a t es, en promedio, n(t'ylt/7, de modo que,

dn(t) n(t)
-dt- = - 1:- (7.2-10)

al integrarse (haciendo que n = n 0 a t = 0), da

(7.2-11)

El número de partículas existentes en el grupo original decae exponencial-


mente, volviendo a la distribución de equilibrio de acuerdo con (7.2-11). Este es
exactamente el comportamiento que predice la ecuación de Boltzmann en la aproxi-
mación del tiempo de relajación (7.2-6). Es más, la distribución de los tiempos
libres, de acuerdo con (7.2-11), también es exponencial, en tal forma que el número
de tiempos libres dn(t) en un intervalo dt con respecto a t es

no
dn(t) =-e-'1
• dt. (7.2-12)
1:
208 Teoría del electrón libre de los metales

El tiempo libre promedio se puede calcular del modo acostumbrado y esto da

t'" t dn(t) f: te-''' dt

Ia''" dn(t) = J: e-r!< dt = T.


(7.2-13)

Entonces, se puede llegar a la conclusión de que la supostcwn de una proba-


bilidad de colisión que es constante con el tiempo para una partícula dada, conduce
al mismo resultado que la aproximación del tiempo de relajación en la ecuación de
Boltzmann, y que el tiempo de relajación de esta ecuación es idéntico al tiempo
libre medio que hay entre colisiones. En el desarrollo anterior se supuso que basta
una sola colisión para hacer que la partícula vuelva a la distribución de equilibrio. Si
no es así (por ejemplo, si se requieren varias colisiones para aleatorizar por completo
la velocidad de una partícula), el tiempo de relajación se debe interpretar como algo
que se refiere al tiempo requerido, en promedio, para que una partícula adquiera
una velocidad totalmente aleatoria, a pesar de que ésta pueda ser muchas veces
mayor que el tiempo medio real entre colisiones.
En el estudio anterior se supuso que en el grupo inicial, todas las partículas
tenían la misma energía. Si la sección transversal de las colisiones varía con la
energía de la partícula incidente, como sucede a menudo, el tiempo de relajación
será diferente para cada valor de energía de partícula, y T será una función de la
energía. También es posible que el tiempo de relajación sea no isotrópico, variando
con la dirección del vector de la cantidad de movimiento de la partícula. Sin em-
bargo, este estudio se limitará solamente al caso isotrópico en el que T puede ser
una función de la energía; pero no de la dirección.
La trayectoria libre media existente entre colisiones se puede definir en la
misma forma que el tiempo de relajación. Si la probabilidad para que una sola
partícula sufra una colisión al atravesar una distancia dx es el valor constante dx(A,
y si se tienen n(x) partículas de un grupo inicial en el que quedan n 0 después de
haber recorrido una distancia x, el número de partículas que choca en un intervalo
de trayectoria dx con respecto a x será n(x)dxj'll., por lo cual,
dn(x) n(x)
--= --dx (7.2-14)
dx A. •

Al igual que antes, esto lleva a

(7.2-15)

Nuevamente, la distribución de longitudes de trayectoria dn(x) dentro de un


intervalo dx alrededor de x es, pues,

dn(x) =no e-x/A dx (7.2-16)


).

y la trayectoria libre media está dada por

_ L"'xdn(x) f 0
,.,xe-x1Adx
X =

t"'
·--- ---- =
dn(x)
.
L'"
---
e-x/A dx -
A
.
(7.2-17)
Conductividad eléctrica de un gas de electrones libres 209

La cantidad A que, como se vio antes, es la recíproca de la probabilidad de


.-:olisión por unidad de distancia, se denomina trayectoria libre media.
La trayectoria libre media se define también en relación con un grupo de
partículas que tienen, todas ellas, la misma energía inicial y que en general debe
.-:onsiderarse como una función de la energía. En el caso de las interacciones elásticas
mutuas que hay entre esferas duras o colisiones elásticas entre partículas esféricas
rígidas y centros de dispersión fijos en forma de esferas duras, se puede ver fácil-
mente que la trayectoria libre media es una propiedad geométrica del sistema y, por
ende, independiente de la energía. Se verá que la dispersión de electrones mediante
fonones de modo acústico en metales y semiconductores, se puede aproximar a
través de este modelo y, en consecuencia, se puede describir de acuerdo con una
:rayectoria libre media independiente de la velocidad. Por supuesto, cualquier trayec-
:oria libre individual l y el tiempo libre correspondiente t están relacionados, por

l = vt, (7.2-18)

ii.n embargo, la relación existente entre la trayectoria libre media A y el tiempo libre
"'"edio T se deben obtener sacando el promedio de la distribución de velocidades y
iependerá en detalle de la forma en que la trayectoria libre media y el tiempo de
~elajación dependan de la energía.

73 CONDUCTIVIDAD ELECTRICA DE UN GAS


DE ELECTRONES LIBRES

Ahora se utilizará la ecuación de Boltzmann para predecir la conductividad


liéctrica y térmica de un gas de electrones libres. En primer lugar se verá una
substancia isotrópica uniforme a temperatura constante en una condición de estado
estacionario bajo la influencia de un campo eléctrico constante aplicado E 0 • Puesto
que el sistema se encuentra en un estado estacionario, df/dt =O y, dado que el
material es uniforme y está a temperatura constante, la función de distribución debe
ser la misma en todas las partes de la muestra, de donde, V/= O. En estas condicio-
nes, la fuerza ejercida sobre un electrón es -eE0 y la ecuación de Boltzmann en la
aproximación del tiempo de relajación se puede escribir como sigue, utilizando
(7.2-3) y (7.2-4)
f-fo
eE0 • V,f= - - . (7.3-1)
't

Si se escoge un sistema de coordenadas de tal modo que el eje z esté en la


dirección E 0 , entonces, E0 sólo tiene una componente z y la ecuación anterior se
puede expresar como sigue
eE0 -r a¡
--=f-fo· (7.3-2)
m av,
En esta ecuación, se supone que la diferencia existente entre f y fo es muy
pequeña, de modo que offozz se puede aproximar por medio de ofo/OVz. Si además
se supone que la función de distribución fo, que describe el estado de equilibrio del
sistema, es una distribución Maxwell-Boltzmann de la forma (5.4-15), entonces,

a¡o = - mv, fo· (7.3-3)


av, kT
210 Teoría del electrón libre de los metales

En estas condiciones, la ecuación de Boltzmann se convierte en

f = fo ( 1 -
eEo·r:vz) =Jo ( 1 -
---¡:;¡- eE 0 -r )
k T v cos (} , (7.3-4)

dado que Vz = v cos {), en donde 8 es el ángulo que hay entre el eje polar z y la
dirección v.
Por definición, la densidad de la corriente eléctrica lz es

(7.3-5)
y vz se puede expresar como

_f vzf(v)g(v)d 3 v

f
Vz = f(v)g(v)d 3 v '
(7.3-6)

en donde g(v) es la densidad de estados por unidad de volumen del espacio de


velocidad y d 3 v es el elemento de volumen apropiado en el espacio de la velocidad.
La notación que se adoptará en esta obra y se utilizará sistemáticamente a partir de
ahora, es que una cantidad con una barra encima, a:, se refiere a un promedio sobre
la distribución real de desequilibrio, en tanto que una cantidad encerrada entre
paréntesis, (a:), se relaciona con un promedio de dicha cantidad tomado sobre la
función de distribución de equilibrio. La única excepción es la velocidad térmica
que, para seguir esta convención, debería escribirse realmente como (v), pero que, de
acuerdo con la convención tradicional, se conservará la notación C. Como se verá, es
más conveniente integrar sobre coordenadas esféricas (v, 8, cp) en el espacio de velo-
cidad y, por tanto, se debe utilizar el elemento de volumen d 3 v = v2 sen 8 dvd8dcp.
Utilizando este elemento de volumen en combinación con la densidad de estados en
el espacio de velocidad, según está dado por ( 5.4-1 7) y la función de distribución
(7.3-4), y observando que Vz = v cos 8, (7.3-6) se puede expresar como

(7.3-7)

En (7.3-7), ya se realizó la integración sobre cp de O a 2rr. Puesto que los


integrandos son independientes de e/>, los factores 2rr obtenidos en el numerador y el
denominador se anulan. Así también, puesto que <vz> es cero (para la situación de
equilibrio), la integral que incluye sólo / 0 en el numerador de (7.3-7) debe ser cero;
es más, en el término dependiente del campo del denominador aparece una integral
angular de cos 8 sen 8 =+sen 28 sobre el rango O< 8 < 7T y, por tanto, este término
también se integra a cero. En consecuencia, la ecuación (7.3-7) se puede reducir a

(7.3-8)
Conductividad eléctrica de un gas de electrones libres 211

Las integrales angulares se pueden evaluar con facilidad, dando

_
Vz =-
eEo o
3kT
f f'"'
'"'v 2 t(v) · v2j 0 (v) dv
=-
E
e o 2
3kT (v t), (7.3-9)
v%(v) dv
o

las integrales restantes representan sólo el promedio (v 2 r (v)> sobre la función de


distribución de equilibrio. No obstante, en un gas de partículas libres de Boltzmann,
la energía cinética promedio por partícula es 3kT/2, de tal manera que

de donde,

(7.3-10)

Al substituir esto en (7.3-9), se puede escribir, finalmente,

(7.3-11)

en donde,

(7.3-12)

El resultado de este método más exacto concuerda con (7.2-7) que se obtuvo
de un modo muy aproximado, excepto por un factor de 2 y por el hecho de que la
cantidad 7, según la da (7.3-12) y (7.3-9) no es precisamente igual a r, excepto
cuando r, es independiente de v.
En este aspecto, es muy común defmir la movilidad de una partícula como la
magnitud de la velocidad promedio de arrastre por unidad de campo. De acuerdo
con (7.3-11), la movilidad ¡.¡. debe estar dada por

p.-
E0
-1 1-
Vz- - -
ei.
m
(7.3-13)

La unidad de movilidad es la velocidad por unidad de campo que, en el


sistema cgs-gaussiano es cm 2 volt- 1 seg- 1 • La densidad de corriente /z es, de acuerdo
con (7.3-5) y (7.3-11),

(7.3-14)

por lo cual,
212 Teoría del electrón libre de los metales

Se debe observar que estos resultados también se pueden establecer de acuerdo


con la movilidad, como sigue,

(7.3-16)

de donde,

u= nep. (7.3-17)

Para evaluar a explícitamente en términos del tiempo de relajación r, es nece-


sario especificar la dependencia de r con respecto a v. Entonces, si r es indepen-
diente de v, de acuerdo con (7.3-9) y (7.3-12), 7 = r. Para el caso en el que la
trayectoria libre media es independiente de la velocidad, r = 'A/v y (7.3-12). (7.3-10)
y (5.4-20) llevan a

_ A.(v) A.c 8 A.
'r=--=---=-- (7.3-18)
(v2) 3kT/m 31t e'

En la expoSicton anterior se supuso, al igual que Drude y Lorentz, que el gas


electrónico se podía describir adecuadamente mediante la distribución de energía de
Maxwell-Boltzmann. Por supuesto, los electrones obedecen en realidad al principio de
exclusión de Pauli y, debido a ello, se tuvo que utilizar la función de distribución
de Fermi-Dirac para que los resultados fueran perfectamente correctos. Si la distri-
bución de equilibrio es la de Fermi-Dirac (5.5-20), se debe escribir, en lugar de
(7.3-3),

(7.3-19)

Al substituir este resultado en (7.3-2) suponiendo nuevamente que offovz se


puede substituir mediante ofofovz, se tiene que

eE0 -r
f = fo - kT fo(l - fo)v cos O. (7.3-20)

Al utilizar esta expresión como la función de distribución en (7.3-6) y obser-


vando que la integral incluida en el primer término de (7.3-20) en el numerador, y
la integral relacionada con el segundo término de (7.3-20) en el denominador, de la
expresión resultante se anulan igual que antes y, después de integrar sobre las coor-
denadas angulares, se llega a

(7.3-21)

En el caso general es imposible evaluar analíticamente estas integrales sobre la


función de distribución de Fermi-Dirac; en cambio, es muy fácil obtener un resul-
tado aproximado que es casi correcto para T 4.. TF, lo cual por supuesto, es lo que
sucede casi siempre para la mayoría de los conductores metálicos en las condiciones
que se encuentran en la práctica.
Conductividad eléctrica de un gas de electrones libres 213

Para lograr esto, es muy conveniente expresar las integrales de (7 .3-21) como
integrales sobre la energía, y no la velocidad, por lo cual se obtiene

(7.3-22)

Se debe observar que para T~TF (es decir, kT~e1), la función de Fermi
f 0 (e) es muy pequeña para e, significativamente en exceso de e¡ y la función com-
plementaria 1 - fo es muy pequeña para valores de e que son mucho menores que
e1. Por tanto, la función producto [ 0 (1 - [ 0 ) es muy pequeña excepto en la cercanía
de e = e1 , como se ilustra en la figura 7.l. Partiendo de (7 .3-19), es fácil demostrar
analíticamente que [ 0 (1 - [ 0 ) es un máximo en e= e¡, en cuyo punto [ 0 (1 - [ 0 ) = t
y que la región sobre la que [ 0 (1 - [ 0 ) no es pequeña en comparación con su valor
máximo, tiene una anchura del orden de kT. Por tanto, la integral del numerador de
(7.3-22) no aumentará de manera significativa, excepto en donde e tiene valores no
mayores de unas cuantas unidades kT de e1. Si e3 12 T(e) es una función que no
cambia mucho en este rango de energías, se puede considerar que [ 0 (1 - [ 0 ) es
esencialmente una función o de Dirac de e - e1 , y se puede escribir, 5

fo(e)(l - fo(e)) ~ A!5(e- e1 ) (7.3-23)

en donde A es un factor de normalización que se debe escoger de tal modo que


cuando (7.3-23) se integra sobre la energía, se obtiene el valor correcto de la inte-
gral del lado izquierdo.

.,
Figura 7.1. Las funciones /o(€), 1 -!o y lo (1 - / 0 ) para un sistema de Fermi, graficadas en
función de la energía. El factor de escala vertical de la curva fo (1 -/o) no es el
mismo que el de las otras curvas.

Puesto que, mediante la integración directa (empleando la substitución u=


(e- e¡)/kT) se puede demostrar que

Joo
o
j 0 (1 -Jo) de =kT
Joo e"du
( + ") 2
-•1 tkT 1 e
= 1+e
kT
•¡tkT ~ kT (7.3-24)

s Véase el apéndice A, donde hay una definición y una explicación de la función o- de


Dirac.
214 Teoría del electrón libre de los metales

y, puesto que la integral de la función 6 es la unidad, es evidente que se debe


tomar A = kT en (7 .3-23), de donde,

j 0 (e)(l - j 0 (e)) g;; kTb(e- e1) (kT ~ e1 ). (7.3-25)

Esto se substituye en (7.3-22) y se evalúa la integral del denominador de la


ecuación, observando que fo(E) es la unidad para O< E< E¡ y cero para E> E¡, que
es una buena aproximación de kT ~ E¡, obteniéndose

_ 2eE0 f 00

0
e3 ' 2 -r(e)b(e - e1 ) de
(7.3-26)
Vz = - _3_m_ !:.....:....._f'"":-~-el_/_2d_e_ __

La densidad de corriente lz =-nevz y la conductividad a se pueden evaluar,


como antes, en relación con (7 .3-15), lo cual da

e-r(e1 )
con J.L=--. (7.3-27)
m

Parece que estos resultados son los mismos que se encontraron para el caso
Maxwell-Boltzmann (7.3-11), etc., excepto que el tiempo libre medio promedio r se
representa mediante el valor r(v) en la "velocidad de Fermi" v1 , en donde

tmv} = e1 . (7.3-28)

En este caso, las estadísticas sólo establecen una diferencia en los detalles de
los promedios y no afectan la conductividad por órdenes de magnitud. Esto se
comprende desde el punto de vista físico, ya que, en cualquiera de los casos, el
campo sólo tiene el efecto de superponer una velocidad de arrastre del orden de
eE0 r/m en todos los electrones de la distribución, como se ilustra en la figura 7.2,
sin tener en cuenta los detalles de su distribución de energía. En todo caso, la
introducción de la estadística Fermi-Dirac, aunque modifica algunos de los detalles,
conserva las características esenciales de la representación del electrón libre de Dru-
de-Lorentz-Boltzmann de la conducción eléctrica, que es básicamente correcta. Sin
embargo, como se verá a su debido tiempo, las capacidades térmicas predichas por
las estadísticas de Maxwell y Fermi-Dirac para electrones libres en metales, son

Figura 7.2. Las distribuciones Maxwell-Boltzmann (MB) y Fermi-Dirac (FD) de la componente


de velocidad z en presencia de un campo eléctrico.
Conductividad térmica y efectos termoeléctricos 215

realmente muy diferentes y, en este caso, el uso de la estadística Fermi-Dirac es


esencial para explicar los resultados experimentales.

7.4 CONDUCTIVIDAD TERMICA Y EFECTOS TERMOELECTRICOS


EN SISTEMAS DE ELECTRONES LIBRES

Al estudiar la conductividad térmica de los electrones libres, es necesario consi-


derar una muestra en la que no haya corriente eléctrica alguna, pero sí un gradiente
de temperatura. Entonces la función de distribución en cualquier punto se caracte-
riza, por la temperatura local y se debe considerar como una función de la posición
y de la energía. Al igual que antes, se supondrá que se trata de una muestra
isotrópica homogénea y, para simplificar, se supondrá que la temperatura varía única-
mente a lo largo de la dirección z. Desde un principio se trabajará con las estadís-
tica de Fermi-Dirac; el caso de la estadística Maxwell-Boltzmann se puede obtener
para una situación especial del resultado Fermi-Dirac, cuando se permite que la
energía de Fermi aumente y sea negativa.
En estas condiciones, la ecuación de Boltzmann para el estado estacionario,
utilizando la aproximación del tiempo de relajación acostumbrada, con r = r(v) se
puede expresar como sigue

(7.4-1)

En esta ecuación, las derivadas de la función de distribución real con respecto


a z y Vz, se han aproximado mediante los valores de la correspondiente función de
distribución de equilibrio análogamente al razonamiento que se empleó para la ecua-
ción (7.3-2). Se supone que el campo E0 sólo tiene una componente z. La ecuación
anterior se puede volver a escribir como sigue

f = fo + -r(eEo aJo - Vz afo). (7.4-2)


m avz az

Si se utiliza la expresión (5.5-20) para representar fo y si se recuerda que e1 es


una función de la temperatura, con la ayuda de (7 .3-19) se puede escribir la canti-
dad of0 /oz como sigue

=fo0-fo)[e-e1 + ae,]aT =[r!...(~) ~]f0 (1-f0 )aT (7.4-3)


kT T aT az aT T +T kT az .

A continuación, la ecuación de Boltzmann se puede escribir en la forma

(7.4-4)
216 Teoría del electrón libre de los metales

Al igual que antes, la densidad de la corriente eléctrica lz es

1 =-env
f vzf(v,z)g(v) d 3 v
=-en~---------- (7.4-5)
z z ff(v,z)g(v) d v ' 3

mientras que a la densidad de la corriente térmica Qz la representará la energía


portada por una partícula multiplicada por la compónente z de su velocidad, y por
la densidad de partículas, de donde,

_
Qz=n(ev,)=n
J evzf(v,z)g(v) dv
- (7.4-6)
J f(v,z)g(v) dv

Al substituir la función de distribución (7.4-4) en (7.4-5) y (7.4-6), se obtienen


expresiones análogas a (7 .3-7). Debido exactamente a las mismas razones que se
indicaron en relación con dicha ecuación, la integral del primer término del numerador de
estas expresiones (incluyendo [ 0 ), deben anularse y también debe desaparecer la integral
del segundo término del denominador (incluyendo [ 0 (1 - [ 0 )). Por tanto, se tiene

en f v!r [
kT/0 (1 - / 0) eE0 +
(
T
iJ(e1 fT)
---aT +T
e) iJT] 3
iJz d v
1 =~~--------~~~--------~--~--
% f 0 (v) d3 v f (7.4-7)

-n f v!r [ ( iJ(e1 /T) e2 ) iJT] 3


kT/0 (1- / 0 ) eE 0 e + eT aT + T i)z d v
Q = ____;:;_,__ _ _ ..;:,_;;--___;_---__;._____;;~
(7.4-8)
z Jf 0 (v) d 3 v

Sin entrar en los detalles de la evaluación de estas integrales y gracias a los


resultados obtenidos en la sección anterior, es evidente, que estas ecuaciones se
pueden expresar como

1, =--
en [ ( eE0 + 1 ,-
iJ(e-
1 /T) iJT) _ 1 iJT - ]
- - t +-- (et) (7.4-9)
m iJT iJz T iJz
y

-n [( iJ(e1 /T) iJT)- 1 iJT- 2 ]


Q, =--;;¡- eE0 + T ---a;¡- iJz (er) + T 0 z (e t) (7.4-10)

en donde las cantidades sobre las que se ha escrito una barra son los promedios
definidos por

(7.4-11)
Conductividad térmica y efectos termoeléctricos 217

Si se observa que mv; = mv 2 cos2 e, y se supone que a es independiente de


las variables angulares, entonces se puede integrar (7.4-11) sobre los ángulos para
obtener

_ m f
v2 tX(v)J0 (1 -Jo)· V2 dv 2 f'-----=------
e312 tX(e)J0 (l -Jo) de
(X = --
3kT f •o .
JI v2 dv
=-
3kT f e ¡,0 de
112
(7.4-12)

En las expresiones (7 .4-12) y (7 .3-1 0), se ve que cuando la distribución de


Fermi se reduce a una distribución de Maxwell (según la cual 1 -lo ~ 1 Y fo =
Ae-efkT), la Ci promedio se reduce a

(7.4-13)

análogamente a (7 .3-12) y los promedios se toman sobre la distribución de Maxwell-


Boltzmann. De igual manera, si la distribución es de tipo Fermi, para la que
kT <t. E¡, se puede emplear (7 .3-25) para representar f 0 (1 - fo ), en donde, aplicando
los mismos métodos usados para llegar a (7.3-26), fácilmente se puede demostrar que

ii = 1X(e1). (7.4-14)

Si no fluye una corriente eléctrica, lz = O, por lo cual, de acuerdo con (7 .4-9),


se debe tener

o(e /T) ar 1 ar (er)


eE 0 + T -1- - --= - - - - (7.4-15)
oT oz T oz i '

de donde,

Eo = _! [_!_ (et) + T o(e1 jT)] oT (7.4-16)


e T i oT oz

o bien,

Eo = T !..__ [(et)- e1
oT eiT
i] oT
oz . (7.4-17)

De acuerdo con esto, parece que aun en ausencia de una corriente, debe existir
un campo eléctrico cuando se tiene un gradiente de temperatura. De hecho, lo hay
y la ecuación anterior es la descripción fundamental del efecto termoeléctrico. Feno-
menológicamente se puede definir el coeficiente de Thomson como el coeficiente de
proporcionalidad que relaciona el campo eléctrico con el gradiente de temperatura
que lo origina, como sigue,

Eo = - ::/ -
q¡-ar
(7.4-18)
oz
218 Teoría del electrón libre de los metales

según lo cual, el coeficiente de Thomson fí debe estar dado por

fí = _ T !..._ [(st)- e1
iJT e'CT
'f]. (7.4-19)

De acuerdo con (7.4-9) y (7.4-10), también es evidente que si existe un campo


eléctrico aplicado que hace que fluya una corriente eléctrica, incluso cuando
oTjoz =O, la corriente térmica Qz no desaparece. Por el contrario, existe una co-
rriente térmica que es proporcional al campo eléctrico E 0 y, por tanto, a la corrien-
te eléctrica. Este efecto se denomina calentamiento Thomson y es muy diferente del
calentamiento ordinario irreversible de Joule que se relaciona con el paso de una
corriente por un medio resistivo. El voltaje que desarrolla un termopar por diferencia
unitaria de temperatura se defme como la diferencia de las potencias termoeléctricas
relacionadas con los dos constituyentes del par. Mediante un argumento termodiná-
mico sencillo,6 se puede demostrar que la potencia termoeléctrica absoluta {!J de
una substancia está relacionada con el coeficiente de Thomson mediante

(7.4-20)

por lo cual, de acuerdo con (7.4-19), se debe tener

f!jJ 'f- (s-r).


= e1
e'CT

Si lz =O, utilizando (7.4-15), el término relacionado con el campo eléctrico


más una contribución que incluye al gradiente de temperatura y la derivada de la
temperatura de la energía de Fermi, se puede eliminar de (7.4-10) para dar
-- __ 2

Qz = _u, iJT = - n ['f(e 2 t) - (st)]


(7.4-21)
iJz mT t

por lo cual, la conductividad térmica at es, sencillamente,


-- __2

u = ~ ['f(s t)- (et)]


2
(7.4-22)
' mT 'f ·

De acuerdo con esto, es evidente que la teoría del electrón libre de Fermi y la
representación del electrón libre de Boltzmann difieren sólo en algunos detalles de
los promedios y que ambos métodos llevan a una conductividad térmica del mismo
orden de magnitud, al igual que ambos predicen más o menos la misma conducti-
vidad eléctrica.
De acuerdo con las investigaciones experimentales de Wiedemann y Franz, la
relación atf(Tae), en donde ae es la conductividad eléctrica, es aproximadamente la
misma para casi todos los conductores metálicos, independientemente de la tempera-
tura. Puesto que a, = ne 2 r/m, la relación Wiedemann-Franz, se puede expresar como
-- _ _2
L = ..!!.!_ = _1_ 'f(s 2 t) - (et)
(7.4-23)
Tue e2T2 t2

6 M. W. Zemansky, Heat and Thermodinamics, McGraw-Hill Book Co., Inc., Nueva York
(1951) página 301.
Procesos de dispersión 219

Esto parece indicar que si r(e) es la misma función de energía para todas las
substancias metálicas, la relación Wiedemann-Franz será la misma para todos los
materiales. Puesto que cada factor de e contribuye kT a los promedios, la relación
Wiedemann-Franz será independiente de la temperatura. En realidad, si r(e) varía
lentamente con respecto a e, la relación Wiedemann-Franz será casi la misma incluso
si r(e) no es la misma función de energía para todas las substancias. En particular,
si la trayectoria libre media X e~ independiente de la energía, entonces, de acuerdo
con (7 .3-18), utilizando la representación clásica del electrón libre de Boltzmann, de
Drude y Lorentz, la conductividad térmica está dada por

(7.4-24)

en tanto que la relación Wiedemann-Franz se convierte en

(7.4-25)

independiente de la trayectoria libre media o la temperatura. La magnitud de L +


según está dada por (7 .4-25) y concuerda de manera aceptable con los valores deter-
minados en forma experimental para casi todos los metales puros.
Si se trata de evaluar la conductividad térmica y la relación Wiedemann-Franz,
por medio de la estadística de Fermi y los valores promedio, como se calcularon de
acuerdo con (7 .4-14), entonces se obtiene el resultado at = L = O! Esta situación
sorprendente se origina debido a la representación de / 0 (1 - [ 0 ) como una función
de l> y el método sólo aproximado de la integral de Fermi en el denominador
(como en (7.3-26)) de las expresiones para los promedios que conducen a (7.4-14),
no es lo suficientemente exacta para estos cálculos. Si e¡ se expresa como kTF en
(7.4-23), es evidente que, en realidad, esto sólo se refiere a una pequefia diferencia
entre dos cantidades muy grandes del orden de (k 2 /e 2 ) (TpfT)l, y las dos cantidades
propiamente dichas se deben expresar con gran exactitud a fin de que su diferencia
sea más o menos correcta. Un método más preciso, como el presentado por Smith, 7
da el resultado

(7.4-26)

(7.4-27)

7 .S PROCESOS DE DISPERSION

En todas las expostcwnes anteriores, la idea central era que los electrones
libres sufren colisiones instantáneas que tienden a hacerles volver a la distribución de
equilibrio; sin embargo, hasta ahora se ha evitado conscientemente el responder a la

7 R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Londres (1961)
página 328.
220 Teoría del electrón libre de los metales

pregunta "¿colisiones con qué? " La fmalidad de esta sección es analizar cualitativa-
mente la respuesta a tal pregunta. Como se verá en detalle en el siguiente capítulo,
los electrones libres que se mueven en forma independiente dentro del potencial de
una red cristalina perfectamente periódica no están sujetos en absoluto a interac-
ciones de dispersión con todos los átomos de la red. Es más, en las colisiones
elásticas que suceden entre los electrones se conservan la energía y cada componente
de la cantidad de movimiento; debido a ello, no se origina ningún cambio neto en la
corriente eléctrica ni en la térmica. Por tanto, los mecanismos de colisión que pro-
ducen la aleatorización de la distribución electrónica deben estar asociados con impu-
rezas, imperfecciones o faltas de periodicidad de un tipo u otro en el cristal.
Sea un cristal que no contiene átomos de impurezas o imperfecciones estruc-
turales en absoluto. Si no existiera el movimiento térmico de los átomos alrededor
de sus posiciones de equilibrio, el potencial eléctrico experimentado por un electrón
dentro del cristal sería perfectamente periódico y no habría mecanismos en absoluto
para hacer que los electrones volvieran al estado de equilibrio térmico por acción de
fuerzas eléctricas o magnéticas externas. Sin embargo, debido a las vibraciones tér-
micas de los átomos, en cualquier momento dado hay una leve aperiodicidad del
potencial dentro del cristal; ésta sirve para dispersar los electrones de conducción.
disipando cualquier velocidad de arrastre que puedan haber adquirido de los campos
aplicados externamente y devolviéndolos al estado de equilibrio térmico. Es evidente
que mientras más alta es la temperatura, tanto más fuertes son las vibraciones de red
y más alta la probabilidad de dispersión por unidad de tiempo. Por tanto, este
mecanismo de dispersión conduce a un tiempo libre medio [y, en consecuencia, de
acuerdo con (7.3-15), a una conductividad] que decrece al aumentar la temperatura.
Esto concuerda con las observaciones experimentales de metales puros.
Puesto que las vibraciones de red se pueden considerar como cuantos semejan-
tes a partículas de energía vibratoria (fonones), la interacción de dispersión entre los
electrones y los fonones se puede describir como un proceso de colisión casi mecá-
nico que incluye a los electrones libres y a los fonones, donde estos últimos se
comportan como partículas neutras cuya masa es mucho mayor que la del electrón. 8
Debido al hecho de que los fonones son neutros, la corriente no se conserva en
estas colisiones. Puesto que la "masa" del fonón es mucho mayor que la masa
electrónica, la fracción de energía que pierde el electrón en la interacción electrón-
fonón es pequeña, aunque por supuesto, el cambio de cantidad de movimiento del
electrón puede ser muy grande. Los electrones pueden interactuar con fonones de
modo acústico u óptico, aunque, dado que se requiere una energía térmica mucho
mayor para excitar a los fonones de modo óptico, la principal interacción a tempe-
raturas moderadas es con fonones acústicos. Las dos interacciones son similares en
sus aspectos cualitativos, aunque conducen a ciertas diferencias cuantitativas en los
coeficientes de transporte, sobre todo la dependencia del tiempo de relajación en
función de la temperatura (de ahí que la movilidad dependa de la temperatura).
A cualquier temperatura dada, el número de fonones disponibles es constante. Puesto
que los fonones se comportan como partículas masivas casi estacionarias, la probabi-
lidad de dispersión por unidad de distancia a lo largo de la trayectoria de un
electrón es una cantidad determinada de un modo puramente geométrico, la cual
sólo depende de la sección transversal geométrica efectiva relacionada con el fonón e
independiente de la velocidad del electrón. Por tanto, la trayectoria libre media es
independiente de la velocidad de partícula en estas circunstancias, como se hizo notar
en la sección 7 .2. El tiempo libre medio está dado por
A.
-r(v) =- (7.5-1)
V

8 Véase, por ejemplo, el problema 4 que aparece al final del capítulo 6.


Procesos de dispersión 221

en donde A es independiente de v, llegando a la relación (7.3-18) entre 7 y A. Por


supuesto, el número de fonones disponibles es una función de la temperatura y, por
tanto, A será una función de la temperatura a pesar de que es independiente de la
velocidad. Este mecanismo de dispersión de red o dispersión de fonón, es el proceso
dominante de dispersión en cristales relativamente puros y estructuralmente perfec-
tos, sobre todo en los rangos de temperaturas elevadas.
Generalmente, si hay un átomo de impureza en un cristal, esto altera el poten-
cial electrostático en las cercanías y crea una aperiodicidad en el campo de potencial
dentro del cristal, que puede actuar para dispersar electrones de conducción. Obvia-
mente, los detalles del proceso de dispersión dependen de la naturaleza del átomo de
impureza, su tamaño iónico, su valencia y la forma en que está enlazado dentro de
la red cristalina. En lo que respecta a otras cosas, la presencia de átomos de impu-
rezas en un cristal puro aumenta el tiempo libre medio que haya entre los eventos
de dispersión y lleva a una reducción de la conductividad eléctrica que será propor-
cional al contenido de impurezas. A decir verdad, este efecto se observa experimen-
talmente en gran número de substancias. 9 El mecanismo de dispersión de impurezas
casi siempre es dominante en cristales que son relativamente impuros o incluso en
muestras muy puras a temperaturas muy bajas, cuando el mecanismo de fonones es
débil. Las imperfecciones estructurales en la red cristalina, tales corno vacíos de red,
átomos intersticiales, dislocaciones y fronteras de grano, también conducen a aperio-
dicidades en el potencial del cristal y, por tanto, a centros de dispersión con los que
los electrones de conducción pueden interactuar. Entonces las propiedades de trans-
porte del cristal reciben la influencia en mayor o menor grado, de la perfección
estructural de la red. En algunas circunstancias, la dispersión de electrones por las
superficies de la muestra también puede ser importante. Ya se vio (en la sec-
ción 6.6) la forma en que la dispersión de superficie de los fonones es a veces un
factor importante en la componente reticular de la conductividad térmica a tempera-
turas bajas.
Si dos mecanismos independientes de dispersión (por ejemplo, la dispersión de
red y la de impurezas) operan simultáneamente para termalizar la función de distri-
bución de energía electrónica, se tendrán dos tiempos de relajación T 1 y T 2 , asocia-
dos con los mecanismos respectivos. En el ejemplo anterior, T 1 puede representar el
tiempo de trayectoria libre que transcurre entre los sucesos de dispersión de red y
r 2 el tiempo libre medio que pasa entre las dispersiones de impurezas. En estas
condiciones, el término de colisión de la ecuación de Boltzrnann se puede escribir
corno sigue

f- fo f- fo f- fo
=------=--- (7.5-2)

en donde

1 1 1
-=-+-. (7.5-3)
T T¡ T2

Esto hace ver que el efecto combinado de dos mecanismos de dispersión se


puede representar mediante un solo tiempo de relajación T relacionado con T 1 y T 2
mediante la fórmula de suma recíproca (7.5-3). De igual manera, si se tienen más de

9 Por ejemplo, esta es la razón por la que se requiere cobre de muy alto grado de pureza
para conductores eléctricos en sistemas comerciales de transmisión de potencia.
222 Teoría del electrón libre de los metales

dos mecanismos, su efecto se puede representar por medio de un solo tiempo de


relajación r dado por

1 1
-=¿-.
• 1 't¡
(7.5-4)

Puesto que, de acuerdo con (7.3-13), las movilidades son directamente propor-
cionales a los tiempos de relajación, las movilidades producidas por mecanismos
independientes de dispersión por separado pueden sumarse recíprocamente en la
misma forma para dar una movilidad combinada de la forma

1 1
-=¿-.
J1. i Jl.¡
(7.5-5)

Las trayectorias libres medias originadas por procesos de dispersión separados


también se pueden sumar recíprocamente para llegar a una trayectoria libre media gene-
ral No obstante, debe observarse que las fórmulas de suma (7.54) y (7.5-5) han de
aplicarse antes y no después de promediar sobre la velocidad.

7.6 EL EFECTO DE HALL Y OTROS EFECTOS


GALVANOMAGNETICOS

Hasta ahora se han estudiado sólo casos en los que un campo eléctrico actúa
sobre las partículas de un sistema de electrones libres. Si además se tiene un campo
magnético, la fuerza ejercida sobre una partícula de carga q está dada por la fuerza
de Lorentz
1
F = q(E + - v X B) (7.6-1)
e

y la ecuación de Boltzmann en el estado estacionario, utilizando la aproximación del


tiempo de relajación, se convierte en

(7.6-2)

La solución de esta ecuación incluye varios efectos galvanomagnéticos que se


originan en la interacción de campos eléctricos y magnéticos, y gradientes térmicos,
con las partículas de la distribución. Por ahora no se verán los detalles de la solu-
ción de la ecuación de Boltzmann, sino que la explicación se restringirá a la descripción
fenomenológica de estos efectos. En un capítulo posterior se hará un análisis más riguroso
de los fenómenos galvanomagnéticos y la forma en que se aplican a semiconductores,
en donde será más fácil llegar a soluciones analíticas exactas.
El más importante de los efectos galvanomagnéticos es el efecto de Hall, en el
que se produce un campo eléctrico en la dirección y como resultado de una corrien-
te que fluye en la dirección x y un campo magnético a lo largo de la dirección z,
según se ilustra en la figura 7.3. En esta figura, un electrón que se mueve con
velocidad vx está sometido a un empuje descendente debido a la fuerza de Lorentz.
En el estado estacionario no puede haber una fuerza neta ejercida sobre el electrón
El efecto de Hall y otros efectos galvanomagnéticos 223

Io-
vH (Medido con un
potenciómetro en
condiciones de
circuito abierto)

Figura 7.3. Geometría del experimento del efecto de Hall.

~- por tanto, lo que sucede es que se desarrolla un exceso de concentración de


electrones en el borde inferior de la muestra, hasta que se genera un campo electros-
tático Ey que equilibra exactamente a la fuerza de Lorentz. Por tanto,

q evxBo
F1 = - (v X B0 ) 1 - eE1 = - - - eE = O (7.6-3)
c e 1 '

por lo cual,

E = vxBo (7.6-4)
' e

Sin embargo, la densidad de corriente 10 es

10 = -nevx. (7.6-5)

Si se expresa Vx de (7.6-4) en función de 10 por medio de (7.6-5), el campo


.ie Hall Ey se puede expresar como

-loBo
E , = - - = Rl 0 B0 (7.6-6)
nec

m donde el coeficiente de Hall R está dado por


1
R=--. (7.6-7)
nec

El campo de Hall es directamente proporcional tanto a 10 , como a B 0 • El


.:oeficiente de Hall R es, sencillamente, la constante de proporcionalidad entre el
:.ampo de Hall y el producto 10 B 0 • El campo de Hall se puede determinar midiendo
ei voltaje de Hall VH de la figura 7.3 de una manera potenciométrica. Por tanto, el
.:ampo de Hall y el voltaje de Hall están relacionados por medio de

(7.6-8)
en donde y 0 es la anchura de la muestra. El coeficiente de Hall R se puede medir si
te conocen VH, 10 y Bo.
El coeficiente de Hall es inversamente proporcional a la densidad n de porta-
dores de carga de la muestra, y una medición de R constituye un modo sencillo de
224 Teoría del electrón libre de los metales

determinar n. Combinando las mediciones del coeficiente de Hall y la conductividad,


se puede obtener la movilidad /J., ya que, de acuerdo con (7 .6-7) y (7 .3-17),
1 JJ.
Ru= --(nep)= - -
nee e
o bien,
1
p = - - Ru. (7.6-9)
e

El análisis anterior del efecto de Hall se ha simplificado en exceso en el


sentido de que todos los portadores de carga no tienen la misma componente de
velocidad Vx y, por tanto, se debe promediar sobre la distribución de Vx. Por lo
general, el efecto de esto es cambiar el valor (7.6-7) por R mediante un pequeño
factor numérico.
De acuerdo con (7 .6-7) si los portadores de carga son electrones, R siempre
debe ser negativo. Se ha encontrado experimentalmente que R es positivo para
muchas substancias metálicas y semiconductoras. La aparición de un coeficiente de
Hall positivo se puede explicar, suponiendo que los portadores de carga son posi-
tivos, en lugar de negativos; pero la teoría del electrón libre de los metales no
proporcionan un modo racional para explicar la presencia de portadores de carga posi-
tivos. Los coeficientes de Hall positivos y la existencia de portadores de carga positivos se
pueden explicar mediante la teoría cuántica, como se verá en el siguiente capítulo.
En el arreglo experimental de la figura 7.3, se establece un gradiente de tem-
peratura a lo largo de la dirección y junto con el campo de Hall Ey. Esto se debe a
que, de acuerdo con la ley de Lorentz de la fuerza, toda fuerza ejercida vertical-
mente hacia abajo sobre los electrones es proporcional a Vx y, por tanto, sobre los
electrones más energéticos y rápidos, la fuerza ejercida v x 8 0 es mayor; en conse-
cuencia, estos electrones tienden a acumularse en la parte inferior de la muestra,
elevando su temperatura con respecto a la parte superior, donde permanecen los
electrones "más fríos". El gradiente de temperatura resultante crea un campo ter-
moeléctrico en la dirección y, el cual está dado por (7.4-17) y origina un voltaje
adicional diferente del voltaje de Hall, en las terminales y de la muestra. Este
fenómeno se conoce como efecto de Ettingshausen, y en algunos casos, puede inter-
ferir mucho en las mediciones de voltaje de Hall. Tal efecto en las mediciones de
Hall se puede eliminar si se utiliza una corriente alterna de muestra, cuyo periodo
sea corto en comparación con la constante térmica de tiempo de la muestra, en
combinación con un detector de corriente alterna.
Cuando la corriente eléctrica / 0 en el experimento del efecto de Hall, se
substituye por una corriente térmica, se puede medir todavía un campo eléctrico a
lo largo de la dirección y. En este caso, existe en promedio un transporte neto de
electrones más rápidos, dentro de la dirección x, desde el extremo vivo o caliente,
hasta el extremo frío de la muestra, y la fuerza v x B0 actúa sobre ellos, para
producir un campo eléctrico, más o menos en la misma forma en que se produce el
campo de Hall, cuando fluye una corriente eléctrica. Este fenómeno se denomina
efecto de Nernts. El campo de Nernst va acompañado por un gradiente de tempera-
tura a lo largo dat la dirección y al igual que lo que sucede con el campo de Hall;
esto origina un voltaje termoeléctrico adicional análogo al de Ettingshausen. El efec-
to termoeléctrico originado por el efecto de Nernst se denomina efecto de Righi-
Leduc.
En un campo magnético, los electrones se desplazan siguiendo trayectorias cur-
vas y no rectas; gracias a este hecho se ha descubierto que, por lo general, la
conductividad depende del campo magnético. Este fenómeno se llama magneto"esis-
tencia y se estudiará más detalladamente en un capítulo posterior.
Capacidad térmica de sistemas de electrones libres 225

7.7 CAPACIDAD TERMICA DE SISTEMAS DE ELECTRONES LIBRES

La teoría clásica del electrón libre de Drude-Lorentz, en la que se supone que


los electrones libres obedecen a la estadística de Maxwell-Boltzmann, lleva a la con-
clusión de que (suponiendo un electrón libre por átomo) la capacidad térmica de los
electrones libres debe ser -fnk, como lo da la figura (5.4-11). Entonces la capacidad
térmica total sería igual a la suma de la contribución reticular dada por la teoría de
Debye, y la contribución electrónica -fnk, y a temperaturas altas, en comparación
con la Debye, el valor límite de la capacidad térmica, sería -!nk. Sin embargo, esta
conclusión está en discordancia con los experimentos, ya que las observaciones in-
dican que el valor asintótico de la capacidad térmica a altas temperaturas difiere
muy poco del valor 3nk predicho por la teoría de Debye para la contribución
reticular sola. Aparentemente, esto indica que la capacida-d térmica de los electrones
libres es mucho más pequeña que el valor predicho a bc;se del modelo Drude-Lo-
rentz-Boltzmann. Esta fue una de las principales fallas del modelo original Drude-
Lorentz, que se propuso primero.
Como se verá más tarde, resulta que cuando se utilizan las estadísticas de
Fermi-Dirac, para describir la distribución de energía drl electrón libre, la capacidad
térmica electrónica calculada es mucho más pequeña q~tl' el valor 3/2nk dado por la
estadística de Boltzmann y, en efecto, es despreciable en comparación con la con tri-
bución reticular a temperaturas moderadas y altas. En consecuencia, el modelo del
electrón libre de Fermi está mucho más de acuerdo con las observaciones experimen-
tales que la teoría original de Drude-Lorentz. La explicación de calor específico
electrónico de substancias metálicas fue uno de los triunfos originales de la estadís-
tica cuántica.
La capacidad térmica del sistema del electrón libre de Fermi-Dirac es mucho
más pequeña porque ~AJo los electrones dentro de unos cuantos kT de la superficie
de la esfera de Fermi pueden recibir energía de una fuent~, térmica externa. Por lo
común, una partícula de un baño térmico externo a la temperatura T sólo dispone
de una energía de unos cuantos kT, para transmitirla a un electrón del sistema de
electrones libres de Fermi. Los electrones que se encuentran en un lugar profundo,
dentro de la esfera de Fermi no pueden interactuar con este tipo de cuerpos exter-
nos excitantes, ya que no existen estados desocupados dentro de unos cuantos kT
de energía, hacia los que puedan excitarse. Sólo los electrones que están cerca de la
superficie de Fermi, en donde existen estados desocupados disponibles, pueden par-
ticipar en las interacciones con una fuente térmica externa.
Para hacer un cálculo exacto de la capacidad térmica, es necesario tener en
cuenta la variación de primer orden de la energía de Fermi con la temperatura. Para
lograr esto, será necesario evaluar la integral

1= f oo
0
acb(e)
f 0 (e) & de. (7.7-1)

en donde / 0 es la función de Fermi y q¡{e) es una función de e que tiene la


propiedad de que
l/J(O) =O. (7.7-2)
Si (7.7-1) se integra por partes, puede verse con facilidad que 1 se puede
expresar en la forma

l = [f 0 (e)c/J(e) ]eo - feo l/J(e) ~de


a¡; = - feo l/J(c) ~
a¡; de, (7.7-3)
o o oe o iJ¡;
226 Teoría del electrón libre de los metales

ya que el producto f 0 (e)r/>(e) se anula en ambos límites. En la expansión de cf>(e)


como una serie de Taylor en torno al punto e= e1, puede escribirse como

f/>(e) = f/>(e¡) +(e- e¡) (of/>) e¡) (oiJe2f/>) t¡ + ... '


2
oe t¡ 1
+ 2(e- 2 (7.7-4)

por lo cual, (7.7-3) se puede expresar como

1 = a0 fj>(e1 ) + a 1 (of/>)
- + a2 (a24>)
- 2 + ... , (7.7-5)
oe t¡ oe •J

en donde

an = - - a¡; de.
1 J<Xl(e- e¡)"~ (7.7-6)
n! o oe

Ahora bien, si kT <{ e1, de acuerdo con (7 .3-19), a¡0 jae es despreciable para valores
negativos de e y los límites de la integral (7.7-6) se pueden extender a oo y - oo. Si
esto se hace, se encontrará que

a0 = - J <Xl
-a;¡
ofo [ J<Xl = 1
- de = fo
oe -oc
(7.7-7)

a1 =- J <Xl
-a;¡
ofo
(e- e1 ) - de= O
oe
(7.7-8)

(7.7-9)

La integral de (7.7-8) se anula porque at0 /ae es una función par de e- e¡ y


el integrando es, por tanto, una función impar de dicho argumento que, cuando se
integra desde - oo a + oo, debe dar cero. La integral de (7.7-9) se pone en la forma
antes indicada, mediante la substitución de x =(e- e¡)/kT; esta forma aparece en
casi todas las tablas estándar de integrales definidas. Al substituir estos valores en
(7.7-5), el resultado es

1= fp
<X> of/>
f 0 (e)-
oe
1t2 (a2 4>) + ...
de= fj>(e1 ) +- (kT) 2 - 2
6 oe •¡
(7.7-10)

Esta fórmula es conveniente para sacar valores aproximados de las integrales de


Fermi, donde la aproximación de la función 8 para a¡0 jae no es suficientemente
buena. Está restringida por la condición (7 .7 -2) y por la condición de que kT <{ e1. Este
método se puede usar para evaluar la relación Wiedemann-Franz para un gas de Fermi;
los detalles quedan como ejercicio para el lector.
Ahora suponga que se escoge

f/>(e) = f~g(e) de (7.7-11)


en donde
a¡p¡ae = g(e) (7.7-12)
Capacidad térmica de sistemas de electrones libres 227

siendo que g(e), como lo establece (5.2-22), se refiere a un sistema de electrones


libres. Por tanto, de acuerdo con (7.7-10),

n f
= oo/ 0 (e)g(e) de =
o
i''<TJ g(e) de + -nz (kT) (a.!!...) .
o 6
2
oe .,
(7.7-13)

Sin embargo, de acuerdo con (5.5-24),

1''(0)
n =Jo g(e) de. (7.7-14)

Al restar (7.7-14) de (7.7-13), se tiene,

6 (kT) 2(aag ) ~ g(e¡) [e¡(T)- e¡(O) J+ 6n2 (kT) 2 (aag ) .


o= f. •,<TJg(e) de+ n2
s¡(OJ e ., e .,
(7.7-15)

En la ecuación anterior se supuso que g(e) no varía mucho en el intervalo de


e¡(O) a e¡(1), que, para kT ~e¡ será sólo una pequeña fracción de e¡(O). Puesto que
g(e) es de la forma ce 1 12 con e igual a una constante. (7.7-15) se puede escribir
como sigue

n2 (kT)z
e1(T) = e1 (0)- - - - . (7.7-16)
12 e¡(T)

Para kT <{ e1 , el segundo término será una pequeña corrección que debe res-
tarse de la cantidad relativamente grande e¡(O) y la diferencia y e¡(1) y e¡(O) será
pequeña, en comparación con e¡(O). En estas circunstancias no se producirá un error
grande si e¡(1) en el término de corrección de (7.7-16) se substituye con e¡(O), lo
cual da, finalmente,

nz(kT\z] (7.7-17)
e¡(T) = e¡(O) [ 1 - 12 e¡(O)/ .

Para evaluar el calor específico electrónico, se escoge

cjJ(e) = f~ e g(e) de (7.7-18)

en donde

ocjJfoe = e g(e) y (7.7-19)

Entonces, al substituir en (7.7-10), se tiene que

oo ocjJ ioo
i f 0 (e)- de = e g(e)f0 (e) de = U (7.7-20)
o oe o
228 Teoría del electrón libre de los metales

U = l •,<T>
o
e g(e) de
n2
+- [ 0 J
(kT) 2 -(e g(e)) .
6 oe .,
También en este caso, si se usa el hecho de que g( e)= ce 1 12 , esto se puede
escribir como,

U = lO
<¡(O)
e g(e) de+
fe¡(T)

e¡(O)
e g(e) de
¡¡;2
+- (kT) 2 ·- g(e1 )
6
3
2

(7.7-21)

Aquí, U0 es el valor de cero absoluto de la energía interna, según se re-


presenta mediante la integral de e g(e) desde O hasta efO), y la integral de esta can-
tidad en el rango pequeño e,(O) a efT) se ha aproximado, siguiendo el mismo pro-
cedimiento que se utilizó en relación con (7.7-15). En el último término de (7.7-21),
g(e) se evalúa a efO) más que en ef1), lo cual introduce sólo un pequeño error. Al subs-
tituir el valor de ef1)-ef0) dado por (7.7-17) en (7.7-12), se puede escribir

(7.7-22)

De acuerdo con (5.2-22) y (5.5-25), g(ej(O)) se puede expresar como

g(e¡(O)) =
sJ2n m3f2[e¡(O)]If2 = 4nm
---¡;J -¡;r- -; (3n) l/J
,

que, puesto que según lo indica (5.5-25), la relación mjh 2 es igual a (3n/rr)21 3 j
(8et(O)), se puede escribir

3n 3n
g(e¡(O)) = 2e1 (0) = 2kTF. (7. 7-23)

Substituyendo este valor en (7. 7-22), se tiene, por último,

(7. 7-24)

La capacidad térmica se obtiene en la forma acostumbrada y el resultado es

e
" ar
= au = n2
2
nk(I..).
TF
(7. 7-25)

Esta expresión difiere del resultado clásico i:nk multiplicado por un factor
(rr 2 /3)(T/Tp), que resulta 0.03 para T=300°K y Tp=30,000°K [un valor típico
para metales simples, calculado a partir de (5.5-25)]. Por tanto, la componente
Capacidad térmica de sistemas de electrones libres 229

electrónica del calor específico, según se calcula mediante la estadística de Fermi,


resulta de sólo una pequeña fracción del valor de Drude-Lorentz fnk, y -es pequeña-
excepto a temperaturas muy bajas en comparación con la contribución reticular.
A temperaturas pequeñas, en comparación con la de Debye, la contribución reticular se
hace muy pequeña, aproximándose a cero, al igual que t 3 conforme T-+ O. En este
rango, la contribución electrónica frecuentemente es un factor importante y, en
ciertas gamas de temperaturas, puede ser incluso el efecto dominante. Se puede
reconocer fácilmente en los datos experimentales, debido a su dependencia lineal de
la temperatura, como lo indica (7. 7-25).

EJERCICIOS

l. Demuestre que si 'T es independiente de v, la función de distribución es una solución apro-

-m(v-vo) 2

f(v) = Ae 2kT
(donde Vu = ;;;- Eo)
ximada de la ecuación de Boltzmann en el caso en que la distribución de Maxwell-Boltzmann repre-
sente la función de distnbución de equilibrio y en donde v0 <{,(kT/m) 112 .
2. Suponiendo la estadística de Maxwell-Boltzrnann, evalúe fa partir de (7.3-12), suponga
que la dependencia de 'T sobre la energía está dada por 1 (E) =A e-s, en donde A y s son
constantes.
3. En un metal como el cobre (resistividad 1.7 X I0-6 ohms-cm), ¿Cuál es, aproximada-
mente, el máximo campo eléctrico para el que podría aplicarse el método del electrón libre de
Drude o Fermi estudiado en la sección 7 .3? ¿Cuál es la densidad de corriente para este valor
del campo?
4. A partir de (7.7-10) y (7.7-17), deduzca las fórmulas (7.4-26) y (7.4-27) para la con-
ductividad térmica y la relación de Wiedemann-Franz de un ga• de Fermi de electrones libres,
usando la aproximación kT 4;.efi0).
5. Si se adopta la representación del electrón libre de Fermi de una superficie metálica,
como se ilustra en el diagrama incluido, demuestre que existe una corriente de emisión termoió-
nica que puede fluir desde la barrera de potencial superficial, y que la densidad de la corriente
termoiónica está dada por

1 - 4TTem(kT)2 -<PotkT.
- h' e Jx.

Suponga que r/>0 , la función de trabajo es ~k T.


6. Demuestre que si la trayectoria libre media es independiente de la velocidad, la conduc-
tividad eléctrica de un gas de electrones libres de Maxwell-Boltzmann, puede expresarse como

a= 4ne 2Afy2TTmkT.
7. Describa físicamente el origen del efecto termoeléctrico. (Nota: considere una barra
larga, la mitad de la cual se mantiene a la temperatura T 1 y la otra a la temperatura T2 (>T 1 )
Y calcule los flujos electrónicos en ambas direcciones en la interfaz entre las dos regiones. Use la
estadística de Maxwell-Boltzmann.)

t</>(x)
T
r-
<Po

~~~~~~~~~~~~~•=O

Superficie
230 Teoría del electrón libre de los metales

LECTURAS RECOMENDADAS
F. J. Blatt, Theory o[ Mobility o[ Electrons in Solids, Salid State Physics, Advances in Research
and Applications, Vol. 4, Academic Press, Inc., Nueva York (1957), pp. 199-366.
J. R. Drabble y H. J. Goldsmid, Thermal Conduction in Semiconductors, Pergamon Press, Oxford
(1961).
J.-P. Jan, Galvanomagnetic and Thermomagnetic E[[ects in Metals, Salid State Physics, Advances
in Research and Applications, Vol. 5, Academic Press, Inc., Nueva York (1957), pp. 1-96.
E. H. Putley, The Hall E[[ect and Related Phenomena, Butterworth & Co., Ltd., Londres (1960).
F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 4.
R. A. Smith, Wave Mechanics o[ Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 1O.
J. Tauc, Photo-and Thermoelectric E[[ects in Semiconductors, Pergmon Press, Oxford (1962).
CAPITULO 8
Teoría cuántica de los electrones
en recles periódicas

8.1 INTRODUCCION

La teoría del electrón libre de los metales, desarrollada en el capítulo anterior,


se basa en la idea de que los electrones de conducción dentro de una substancia
metálica actúan como las partículas libres clásicas de un gas, sometidas sólo a las
limitaciones de la estadística de Fermi-Dirac. Desde el punto de vista de la mecánica
cuántica, no es evidente por qué debe suceder esto. Tampoco es evidente por qué
algunas substancias tienen gran cantidad de electrones libres y, por tanto son muy
buenas conductoras, mientras que otras apenas tienen algunos y se comportan como
aisladores.
El punto de vista más sencillo de la mecánica cuántica r<"specto a un electrón
. contenido en un cristal, es el de un solo electrón que se encuentra en un potencial
perfectamente periódico que tiene la periodicidad de la red. En este modelo de un
solo electrón de un sólido, el potencial periódico se puede considerar como resultado
de la distribución periódica de carga asociada con los núcleos iónicos situados en los
puntos reticulares, más el potencial "extendido" promedio (constante) aportado por
todos los demás electrones libres que pertenecen al cristal, de tal manera que se
tiene en cuenta la interacción promedio de un solo electrón con todos los demás.
En consecuencia, la solución de la ecuación de Schroedinger para un solo electrón
dentro de este potencial, proporciona un conjunto de estados de "un solo electrón"
que pueden estar ocupados exclusivamente por un electrón y, de hecho, que pueden
estar ocupados (de acuerdo con las limitaciones del principio de Pauli) por todos los
electrones del cristal, ya que el electrón único que se consideró inicialmente se
puede clasificar como típico de todos los electrones del sistema. La figura 8.1 mues-
tra una representación unidimensional del potencial de un cristal periódico, como el
que podría obtenerse siguiendo una trayectoria a lo largo de una de las direcciones
;} 00> de un cristal cúbico con una constante de red a. En lo que respecta a la
representación cuántica de un electrón, normalmente se supondrá que la periodicidad
del cristal se extiende al infinito en todas las direcciones; pero, por supuesto, en la
ruperficie de cualquier cristal real la periodicidad se interrumpe siendo entonces la
función del potencial algo semejante a lo que se ilustra en el extremo izquierdo de
la figura 8.1. El espaciamiento reticular no será muy uniforme cerca de una super-
ficie de esta naturaleza; pero, como cuestión práctica, generalmente se encontrará
que la periodicidad de red es casi perfecta después de unos cuantos espaciamientos
Jtómicos dentro del cristal.

231
232 Teoría cuántica de los electrones en redes periódicas

Se descubrirá que las funciones de onda de un ele~trón (denominadas funcio-


nes de Bloch) calculadas con el método anterior, siempre tienen ciertas propiedades
íntimamente relacionadas con la periodicidad reticular y que las energías electrónicas
permisibles ocurren en bandas de estados permitidos que están separados por regio-
nes de energía prohibidas. Dentro de las bandas de energía permitidas se notará que
el comportamiento dinámico de los electrones es muy similar al de las partículas
libres. La cuestión de si un cristal es un conductor o un aislador, dependerá de si
los estados electrónicos dentro de una banda o conjunto de bandas permisibles dadas
están llenos por completo o parcialmente vacíos. Además, se verá que el comporta-
miento colectivo de los electrones dentro de una banda de estados permisibles casi
llena, es muy semejante al de unos cuantos portadores de carga positiva en una

Superficie -x

Figura 8.1. Representación esquemática del potencial dentro de una red cristalina perfectamente
periódica. La barrera de potencial de la superficie se muestra a la izquierda.

banda casi vacía. Por tanto, la representación de un solo electrón libre sirve para
justificar el modelo del electrón libre desde un punto de vista fundamental y tam-
bién para contestar a ciertas preguntas difíciles que la teoría del electrón libre por sí
sola, ni siquiera podría tratar de explicar. No obstante, debe recordarse que el
método del electrón único es una aproximación en la que se omiten completamente
los detalles de las interacciones electrón-electrón.

8.2 EL TEOREMA DE BLOCH

El teorema de Bloch 1 es una proposición matemática relacionada con la forma


de las funciones de onda de un electrón para un potencial perfectamente periódico.
Sea una ecuación diferencial de la forma

d21/1
- 2 + f(x)ljl(x) =O (8.2-1)
dx

1 F. Bloch, Z. Physik 52, 555(1928); los matemáticos han estado familiarizados con el
mismo resultado con el nombre de Teorema de Floquet. Por ejemplo, véase E. l. Whittaker y
(;.N. Watson, Modern Analysis. Cambrid~~e University Press (1948), página 412.
El teorémo de Bloch 233

en donde f(x) es una función dada que es periódica con un periodo a, de tal
manera que

f(x +a)= f(x). (8.2-2)

Si es periódica la función de potencial V(x) para la ecuación unidimensional de


Schrodinger de la forma ( 4.8-5), entonces la ecuación de Schródinger será un caso
especial de la ecuación (8.2-1). Puesto que (8.2-1) es una ecuación diferencial lineal
de segundo orden, (para cualquier valor dado de energía e en 4.8-5) existen dos solu-
ciones independientes g(x) y h(x) tales que

t/J(x) = Ag(x) + Bh(x) (8.2-3)

representa la solución más general de (8.2-1). Puesto que f(x+a)=f(x), no sólo


g(x) y h(x), sino que también g(x+a) y h(x+a) satisfacen (8.2-1). Sin embargo,
.ualquier solución de (8.2-1) se puede expresar como una combinación lineal de g(x)
y h(x) de la forma (8.2-3). Entonces, en particular,

g(x + a)= o: 1 g(x) + o: 2 h(x)


(8.2-4)
h(x + a) = P1 g(x) + P2 h(x)
en donde a 1 , a 2 , {3 1 y {3 2 son constantes. Por tanto,

tf¡(x +a)= Ag(x +a)+ Bh(x +a)

(8.2-5)

Ahora, ¡J;(x +a) siempre se puede expresar en la forma

tf¡(x +a)= A.tf¡(x), (8.2-6)

en donde A es una constante, a condición de que se escoja el valor adecuado para A.


Al comparar (8.2-5) y (8.2-3), se observa que si (8.2-6) debe satisfacerse, entonces,

. (8.2-7)

Este sistema de ecuaciones homogéneas en A y B tienen soluciones diferentes a


A = B =O, sólo si

(8.2-8)

La solución de esta ecuación cuadrática en A sirve para determinar los dos valores
posibles de A para los que (8.2-6) es cierta. Si se les desigana como A¡ y ;\.2 ,

tf¡(x +a)= A. 1 t/l(x) (8.2-9)

tf¡(x + a) = A. 2 t/J(x).
234 Teoría cuántica de los electrones en redes periódicas

Si ahora se definen k 1 'y k 2 de tal modo que

(8.2-10)

y se define uk 1(x) y uk 2(x) como

uk,(x) = e-ik,xif¡(x)
(8.2-11)

si se utiliza (8.2·11), (8.2·9) y (8.2-10), es evidente que

(8.2-12)

La función uk entonces es periódica con un periodo a; de un modo similar esto


mismo es aplicable ~ uk 2 (x ). Por tanto, de acuerdo con (8.2-11 ), 1/l(x) puede escri-
birse siempre en la forma

(8.2-13)

en donde uk(x) es una función periódica con un periodo a, y en donde k representa


ya sea a k 1 o a k 2 tal y como se determinaron antes. Este es el teorema de Bloch
y todas las funciones de onda de un electrón para potenciales periódicos se pueden
escribir de este modo. En tres dimensiones, el teorema de Bloch se convierte en

(8.2-14)

Las funciones de onda (8.2-13) y (8.2-14) tienen claramente la forma de ondas


planas con un vector de propagación k modulado por una función cuya periodicidad
es la de la red cristalina.
La función de Bloch (8.2-13) se puede considerar como la manera más general
de escribir una solución de la ecuación de Schrodinger que conducr a la misma
densidad de probabilidad 1/1* 1/1 en cada célula unitaria del cristal. De acuerdo con
(8.2-13), es evidente que en la nésima célula unitaria, debido a la periodicidad de uk,

(8.2-15)
De igu?l manera,
1/J*(x + na)= e-iknal/l*(x) (8.2-16)
y
1/J*(x + na)if¡(x + na)= 1/J*(x)if¡(x). (8.2-17)

La función de onda tridimensional (9.3-14) tiene el mismo tipo de comportamiento.


En el caso unidimensional, para un cristal infinito, se puede encontrar una
solución formal a la ecuación de Schrodinger para cualquier valor de energía e
El modelo de Kronig-Penney de un cristal infinito unidimensional 235

dentro de ciertos rangos, y se tienen dos valores de k correspondientes a cada uno


de estos valores de e, por medio de (8.2-8) y (8.2-10). Los valores propios de
energía permitidos para dicho sistema, dentro de esos rangos, son continuos. Por
otra parte, si el cristal tiene una extensión finita, en cuyo caso, sobre la superficie
se deben satisfacer las condiciones físicas apropiadas de frontera, entonces, las solu-
ciones que satisfagan la ecuación de Schrodinger y, a la vez, las condiciones de
frontera pueden encontrarse pero, sólo para ciertos valores propios de energía discre-
ta. Puesto que por cada valor propio de energía se tienen sólo dos valores relacio-
nados de k, los valores permisibles de k forman también un conjunto discreto. En
este caso, la solución es muy similar a la que se encontró en relación con las
vibraciones mecánicas de una red periódica y que se analizó en la sección 3.3. Por
supuesto, cuando el número de átomos dentro del cristal se hace demasiado grande,
los valores permitidos de e y k, aunque siguen siendo discretos, se amontonan
mucho y en la mayoría de los casos se pueden considerar como bandas casi conti-
nuas de valores permisibles. Los cristales tridimensionales tienen el mismo comporta-
miento cualitativo, excepto que en este caso, se tienen más de dos valores permisi-
bles de k para cada valor propio de energía.
Por ejemplo, si se imponen condiciones periódicas de frontera a un cristal
unidimensional de N átomos (o si se supone que la red tiene la forma de un anillo
de N átomos), entonces, si la funcion de onda 1/1 debe tener un solo valor, es
necesario (utilizando (8.2-15)) que

t/l(x +Na)= eikNatf¡(x) = t/J(x) (8.2-18)

.JOr lo cual,
eikNa = 1

o bien,
2n:in
eika = (l)lfN =e--¡¡- (n = 0,1,2, ·· · N - 1), (8.2-19)

recordando la forma de las Nésimas raíces de unidad. Si se toma el logaritmo de


ambos lados de esta ecuación y se resuelve para k, se encontrará que, en estas
condiciones de frontera, los valores posibles de k son

2nn
k=-
n Na
(n = 0,1,2, ... N). (8.2-20)

Si N es grande, habrá muchos valores permitidos de k dados por (8.2-20) y, en


este caso, se puede considerar que forman un rango casi continuo de valores. Por
supuesto, los N valores distintos de k permitidos por (8.2-20) no corresponden al
mismo valor de energía. Por cada valor constante de e se tendrán sólo los dos
valores permitidos de k dados por (8.2-10).

8.3 EL MODELO DE KRONIG-PENNEY DE UN CRISTAL


INFINITO UNIDIMENSIONAL

Para el caso del potencial periódico infinito de un pozo cuadrado unidimen-


sional que se ilustra en la figura 8.2, se puede llegar a una solución exacta de la
236 Teoría cuántica de los electrones en redes periódicas

ecuación de Schródinger. Kronig y Penney 2 fueron los primeros en investigar esta


solución y, aunque se relaciona con un potencial periódico algo idealizado que cons·
tituye sólo una aproximación burda del que se encuentra en un cristal real, es de
gran utilidad porque sirve para ilustrar de un modo más explícito muchas de las
características físicas importantes del comportamiento cuántico de los electrones en
redes periódicas. Las funciones de onda asociadas con este modelo se pueden calcu·
lar con aproximación de un electrón, resolviendo la ecuación de Schrodinger

d 2 1/1 2m
dx 2 + ¡r- (e- V(x)(l/l(x) =O (8.3-1)

para un solo electrón dentro del potencial periódico V(x) según se ilustra en la fi.

¡V (x)
-Vo
o

u-J
U2
1 a+b~
(celda
unitaria)
u,(x)
--__..,X

Figura 8.2. Potencial periódico ideal de pozo cuadrado usado por Kronig y Penney para ilustrar
las características generales del comportamiento cuántico de los electrones en redes
periódicas.

gura 8.2. Puesto que, de acuerdo con la sección anterior, las funciones de onda deben
tener la forma de Bloch, se puede esperar que

(8.3-2)

Al substituir (8.3-2) en (8.3-1), se encuentra que la función u(x) debe satisfacer

d2u du ( 2m V(x))
dx2 + 2ik dx- k2 - cx2 + ¡¡2 u(x) =O (8.3-3)

en donde

(8.3-4)
Para el potencial de la figura 8.2, se encontrará que

(0 < x <a) {8.3-5)

2. R. de L. Kroni~ y W. G. Penney, Proc. Roy. Soc. Al30, 499 (1931).


El modelo de Kronig-Penney de un cristal infinito unidimensional 237

( -b <X< 0), (8.3-6)

en donde u 1 (x) representa el valor de u(x) dentro del intervalo (O<x<a) y u 2 (x)
representa el valor de u(x) dentro de (- b < x < 0), y en donde

(8.3-7)
Las ecuaciones rliferenciales (8.3-5) y (8.3-6) se resuelven fácilmente mediante
procedimientos normales y se obtiene

(0 < x <a) (8.3-8)

( -b <X< 0}, '(8.3-9)

en donde A, B, e y D son constantes arbitrarias. Se observará que la cantidad (3 es


puramente imaginaria para O< e< V0 .
El requisito de continuidad para la función de onda 1/J y su derivada en x = a
y x =- b, requiere que la solución u(x) satisfaga estas mismas condiciones, ya que
en (8.3-2) eikx es una función apropiada. Si se aplican estas condiciones de frontera
(y se recuerda que, dado que u(x) tiene la periodicidad de la red, u 1 (a)= u 2 (- b )), se
encuentra que

i(a. - k)A - i(a. + k)B = i(p - k)e - i(P + k)D


(8.3-10)
Aei<cx-k)a + Be-i<cx+k)a = ee-i<IJ-klb + Dei<IJ+k)b
i(a.- k)Aei(cx-k)a- i(a. + k)Be-i(cx+k)a = i(P- k)ee-i(/1-k)b- i(p + k)Dei(/l+k)b

Por tanto, los coeficientes A, B, e y D se pueden determinar como la solución


de un grupo de cuatro ecuaciones homogéneas simultáneas y lineales en dichas canti-
dades. Por supuesto, no existe ninguna otra solución aparte de A = B = e= D = O, a
menos que desaparezca el determinante de los coeficientes. Esto requiere que

1 1 1 1
a.-k -(a.+ k) P-k -(P +k)
ei(cx-k)a e-i(cx+k)a e-i(/1-k)b ei<fJH)b =O.
(a._ k)ei(cx-k)a -(a.+ k)e-i(cx+k)a (p _ k)e-i<IJ-k)b -(P + k)ei(/l+k)b
(8.3-11)

Al expander el determinante, se puede demostrar, después de muchas operacio-


nes algebraicas tediosas, pero directas, que (8.3-11) se puede expresar como

a.2 + p2
- ·--:¡;¡¡-sen a.a sen Pb + cos a.a cos Pb = cos k( a + b). (8.3-12)
238 Teoría cuántica de los electrones en redes periódicas

Puesto que en el rango (O< e< V0 ), {3 es imaginaria según lo define (8.3-7),


para estos valores de energía es más conveniente expresar (8.3-12) en una forma
ligeramente distinta. Haciendo que

f3 = iy (8.3-13)

en esta región y observando que cos ix = cosh x y sen ix = i senh x, la ecua-


ción (8.3-12) se puede escribir como sigue

y2 - a2
- 2- - senh yb sen aa + cosh yb cos cxa = cos k( a + b), (8.3-14)
ay

en donde 'Y es una cantidad real positiva en el intervalo (O< e< V0 ), al igual que {3
lo es en el intervalo (V0 <e<""). En consecuencia, es más conveniente usar
(8.3-12) cuando (V0 <e<oo) y (8.3-14) cuando (O<e< V0 ).
Las funciones de onda (8.3-2), como todas las funciones de onda, deben tener
un comportamiento adecuado conforme x tiende a ± oo. Puesto que u(x) es una
función periódica cuyos valores son los mismos en cada célula unitaria, no se en-
cuentran dificultades en este aspecto a condición de que el factor eikx de (8.3-2) se
mantenga finito en estas condiciones. Sin embargo, eikx cumple con lo anterior
tanto en + oo como en - oo sólo si k es real, por lo que eikx es oscilatoria. Si k
fuere imaginaria, eikx divergiría al infintio ya sea en + oo o - oo, y la expresión
resultante para ¡J¡(x) no se comportaría debidamente como función de onda. Por
tanto, se deben aceptar sólo funciones de la forma (8.3-2) con, valores reales de red
k. Las expresiones anteriores (8.3-12) y (8.3-13) tienen en el lado izquierdo una
función de la forma K 1 senaa+K 2 cosaa que debe ser igual a cosk(a+b). Si para
un valor dado de energía la función del lado izquierdo de estas ecuaciones cuenta
con un valor dentro del rango comprendido entre + 1 y - 1 . el valor requerido
para cos k(a+ b) se obtiene con un valor real para el argumento k(a+ b ), Por otro
lado, si el valor de la función del lado izquierdo de (8.3-12) o (8.3-14) queda fuera
de dicho rango, esto significaría que cos k(a + b) tendría que ser mayor que + 1 o
menor que - 1, lo cual, a su vez, requiere que el argumento k( a + b) sea un número
complejo con una parte imaginaria diferente a cero. En estas circunstancias, las
soluciones (8.3-2) no se comportarían debidamente en infinito y no satisfarían el
requisito físico para las funciones de onda del sistema. Las energías asociadas con
estos valores de k estarían prohibidas para el electrón.
Los lados izquierdos de (8.3-12) y (8.3-14) se pueden escribir en la forma
K 3 sen(aa -6), en donde K 3 =(K~ +KD 1 12 y tan 6 = K¡fK2. En esta forma (8.3-12)
y (8.3-14) se pueden escribir como sigue

(8.3-15)

en donde
a2 + {32
tan éJ =- 2af3 tan flb CVo <e< oo)
y
[1 +
(a2 + /)2 ] 1/2
4a 2 y2 senh 2 yb cos(aa - <5) = cos k(a + b), (8.3-16)

rn clonde
a2 + y2
tan <5 = 2ay tanh yb (O< e< V0 ).
El modelo de Kronig-Penney de un cristal infinito unidimensional 239

De acuerdo con estas expresiones, es evidente que en ambos casos, el lado


izquierdo tiene la forma de una función coseno por un factor de modulación cuya
amplitud es invariablemente mayor que la unidad. El valor de este factor de modu·
!ación en realidad, es un máximo para a= O (y, por tanto, para e= O), y se acerca
a la unidad en el límite de las energías grandes, en donde a ~ (3.
Cuando los lados izquierdos de (8.3·15) y (8.3-16) se grafican como una fun-
ción de la energía, en cuyo caso se debe observar a partir de (8.3-4) y (8.3-7) que

(8.3-17)

los resultados son como se ilustra en la figura 8.3. En esta figura, el lado izquierdo
de (8.3·15) o (8.3-16) aparece graficado en función de la energía. Cuando la orde·

f(•)

+,.
k==-
o+b

Figura 8.3. Gráfica de las funciones del lado izquierdo de (8.3-15) y (8.3-16) en función de la
energía. Las regiones sombreadas señalan las bandas de energía prohibidas en donde
el valor de k es complejo, las regiones no sombreadas son las bandas de energía
permisibles correspondientes a valores reales de k.

nada de la curva está entre + 1 y - 1, existe un valor real para k correspondiendo a


funciones de onda físicamente posibles. No obstante, fuera de estos límites, k debe
ser compleja con una parte imaginaria diferente a cero. Estos valores de k nunca
pueden producir funciones de onda con un significado físico; los rangos de energía
correspondientes están prohibidos y se ilustran en la figura 8.3 como las regiones
sombreadas. Por tanto, se tienen regiones alternas de valores propios permisibles y
regiones prohibidas. Estas regiones se denominan casi siempre bandas de energía
permisibles y prohibidas y el agrupamiento de los valores de energía permisibles en
estas bandas es una de las características típicas más importantes del comporta·
miento de los electrones en redes periódicas. Se puede demostrar que las bandas de
energía que tienen los mismos aspectos cualitativos que los que se indican en la
figura 8.3, se forman sea cual fuere la forma detallada del potencial, siempre y
cuando sea periódico.
240 Teoría cuántica de los electrones en redes periódicas

c(k)

1
1
1
1
1
1 1
/-Partícula libre
1 (e= ·Pk 212m l
1

1 •o
\ 1
'i
l\ A
1\ 1 1
1 1
1
1 1
1 1
1 1
1 1
1 1
1- k(•ol lk(•ol
-3,. -2,. ~ o _!!_ k _k ..1!_
-*
o•b o•b o•b o•b o+b o+b o+b

Figura 8.4. La energía € graficada como una función de k de acuerdo con (8.3-15) y (8.3-16).

Si se usan (8.3-1 5), (8.3-16), (8.3-4) y (8.3-7), se puede grafic:.~r una curva que
presente a la energía e como una función de k. En la figura 8.4 se muestra el
resultado de una manera esquemática. Las bandas de energía prohibidas y la relación
de e en función de k dentro de las diferentes bandas permitidas, se han asignado de
acuerdo con el patrón que aparece en la figura 8.3. Puesto que cos- 1 k(a + b) n0 es
una función de un solo valor, esta asignación es necesariamente arbitraria. Para
energías grandes, es aparente que la función e(k) se acerca a la relación del electrón
libre e= h2 k 2 /2m (que se ilustra con la curva punteada de la figura 8.4) de un
modo muy semejante dentro de las bandas permitidas. Así también, para energías
grandes, se ha encontrado que las bandas permitidas se hacen muy anchas y las
regiones prohibidas muy angostas. No obstante, la curva e(k) siempre tiene una
pendiente cero en los bordes de las bandas permisibles, es decir, cuando k = ± mr/
(a+ b), siendo n un entero. Este resultado se puede corroborar mediante la deriva-
ción directa de (8.3-1 S) y ( 8.3-16); pero aquí no se verán los detalles de estos
cálculos. Esta característica de la curva e(k) es muy general y se puede demostrar
que se presenta incluso en el caso tridimensionaL independientemente de la forma
matemática precisa de la función de potencial.

8.4 CANTIDAD DE MOVIMIENTO DEL CRISTAL


Y MASA EFECTIVA

Si la función uk(x) de (8.2-13) es una constante, la función de onda tiene la


forma e±ikx correspondiente a un electrón perfectamente libre cuya cantidad de
Cantidad de movimiento del cristal y moSil efectiva 241

movimiento es p = ± lik y cuya energía, de acuerdo con los resultados de la sec-


ción 4.9, sería

(8.4-1)

En la figura 8.4 se ilustra esta relación por medio de la curva punteada. Para
valores grandes de e, la relación real e en función de k se acerca mucho a esta
relación. De acuerdo con (8.2-13) y los resultados de la sección anterior, es evidente
que k es una constante del movimiento, que lik tiene las dimensiones de una canti-
dad de movimiento y que al aumentar la energía del electrón (haciéndose, por ende.
la partícula mucho más "libre"), los valores de k se aproximan en general a los de
la cantidad de movimiento de la partícula libre dividido.; entre h. Se puede ver con
facilidad que estas conclusiones se deben aplicar sea cual fu~re la forma partícular
que adquiera el potencial periódico. Por tanto, se acostumbra referirse a lik corno la
cantidad de movimiento del cristal y, corno se verá en breve, sucede en muchos
casos que el comportamiento dinámico del electrón dentro de la red cristalina, con
respecto a la cantidad de movimiento del cristal, es muy similar al de una partícula
libre con respecto a la cantidad de movimiento real. Para que quede perfectamente
clara la diferencia entre la cantidad de movimiento real y la cantidad de rnovi.Jnjento
del cristal, se debe observar que debido a la presencia del potencial de red, la
cantidad de movimiento real instantáneo de un electrón no es en absoluto una
constante del movimiento y no se calcula directamente por métodos de la mecánica
cuántica, excepto corno un valor promedio, en tanto que para un estado de energía
dado, la cantidad de movimiento del cristal lik es un valor constante perfectamente
bien definido al igual que lo es la cantidad de movimiento real de una partícula
libre de cierta energía.
Ahora se verá el movimiento de un electrón dentro de un cristal bajo la
influencia de un campo eléctrico aplicado. Para comprender mejor el movimiento de
un electrón en esta situación, se deberá localizar la función de onda superponiendo
soluciones que tienen distintos valores de k, corno se hizo en la sección 4.9. Si se
hace esto, la velocidad de grupo asociada con el "paquete de ondas" del electrón, es

dw 1 de
Vg = dk = h dk' (8.4-2)

en donde, por supuesto, e y w tienen una conexión a través de la relación de


Planck e= :liw. Supóngase que hay un campo eléctrico externo E que actúa sobre el
electrón, que adquiere un incremento en velocidad dvg en una distancia dx, en un
tiempo dt. Entonces, si se usa (8.4-2), se observa que

de eE de
de=-dk= -eEdx= -eEv dt= - - - d t (8.4-3)
dk g li dk '

de donde,
eE
dk= --dt (8.4-4)
li '
o bien,

dk dp
li - = - = -e E =F (8.4-5)
dt dt '
242 Teoría cuántica de los electrones en redes periódicas

en donde ahora se tiene el símbolo p para denotar la cantidad de movimiento del


cristal. La ecuación (8.4-5) indica que la capacidad de cambio respecto al tiempo de
la cantidad de movimiento del cristal es igual a la fuerza - eE. Por tanto, es análoga
a la ley de Newton, que demuestra que la cantidad de movimiento del cristal del
electrón en una red periódica cambia bajo la influencia de un campo aplicado, en la
misma forma que lo hace la cantidad de movimiento real de un electrón libre en el
vacío.
Si se deriva la expresión (8.4-2) con respecto al tiempo, el resultado es

(8.4-6)

que, usando (8.4-5), se puede escribir como sigue

(8.4-7)

en donde la masa efectiva m* está dada por

(8.4-8)

La expres10n (8.4-7) es fundamentalmente la ecuac10n de fuerza, de Newton.


El factor de proporcionalidad que relaciona a la fuerza eE y a la aceleración dgg/dt
se puede considerar como la masa efectiva del electrón. Sin embargo, la masa gravi-
tacional real del electrón no se relaciona directamente con la masa efectiva; se trata
de la cantidad d 2 e/dk 2 que es el factor importante. Si el electrón en realidad es
libre, entonces e y k se relacionan por medio de (8.4-1) y (8.4-8) se reduce a
m*= m. Si la energía es una función parabólica de k, que tiene la forma

(8.4-9)

entonces, la masa efectiva tiene un valor constante m*= h2 /2C y el comportamiento


dinámico del electrón será el mismo que el de una partícula libre con esta masa
efectiva. Si la energía no es una función parabólica de k, entonces dicha masa no
será constante con la energía y el comportamiento dinámico será el de una partícula
de masa variable complicándose con ello la situación. En cualquier caso, para una
primera aproximación, todo el efecto del potencial del cristal periódico reside en
substituir la masa del electrón libre por una masa efectiva.
Afortunadamente, la relación que asocia a e con k es casi siempre parabólica o
casi parabólica sobre el rango de energías accesible a un electrón dentro del cristal.
De acuerdo con la figura 8.4, parece ser que la curva e en función de k tiene
siempre una forma parabólica en la base y la parte superior de las bandas de energía
permisibles. Sin embargo, incluso cuando los electrones del sistema están en otras
regiones, lo importante es que la masa efectiva sea fundamentalmente constante
sobre un intervalo de energía, del orden de la cantidad promedio de energía que una
partícula puede adquirir o perder en un solo evento de dispersión, o entre varios
eventos de dispersión en un tiempo del orden del tiempo de relajación. Esta can-
tidad de energía es del orden de kT No obstante, a 300°K, kT representa sólo
0.025 eV, y la anchura total de una banda de energía que puede desempeñar un
papel importante en los procesos de transporte en substancias cristalinas típicas es
Representación de zona reducida; electrones y huecos 243

mucho mayor que esto casi siempre del orden de 1 eV. En eventos de dispersión
independientes o en intervalos entre eventos de dispersión sucesivos, un electrón estará
confinado casi siempH~ dentro de un corto segmento de la curva E en función de k,
que casi siempre se puede considerar como aproximadamente parabólico.
Esto hace ver que la representación del electrón libre en un metal está justi-
ficada en su mayor parte, y la única corrección importante es que la masa del
electrón libre debe substituirse en todos los casos por una masa efectiva apropiada
relacionada con la forma de la curva E en función de k, por medio de (8.4-8). En
consecuencia, se llega a la conclusión de que todos los resultados derivados en el
capítulo 7 basándose en la teoría del electrón libre, son correctos a condición de
que la masa del electrón se substituya con la masa efectiva apropiada. La masa
efectiva se puede deducir por comparación de los datos del calor específico electró-
nico que se han obtenido a través de la experiencia, con el resultado del electrón
libre dado por la ecuación (7. 7-25); también se puede L alcular desde el punto de
vista de la mecánica cuántica principiando con las funcione~ de onda atómicas auto-
consistentes para los átomos del cristal, que luego se combinan para dar un potencial
de cristal apropiado para la substancia en cuestión. Los valores calculados de este
modo concuerdan casi siempre con los que se determinan de un modo experimental.
Para la mayoría de los metales, la masa efectiva varía entre la mitad y el doble de
la masa del electrón libre, aunque para muchos metales de transición es mucho
mayor y para ciertos compuestos del tipo III-V puede ser mucho menor.

8.5 REPRESENTACION DE ZONA REDUCIDA;


ELECTRONES Y HUECOS

En la figura 8.3 se ilustra la asignacwn de rangos de valores para k dentro de


cada banda de energía permitida, lo cual produce la curva que aparece en la figu-
ra 8.4. Puesto que el único requisito que se debe llenar dentro de cada banda es
que - 1 .:;;; cos k(a + b) .:;;; + 1, es evidente que esa asignación de valores para k a
cada banda no es única. La ventaja de la asignación ilustrada en la figura 8.3 es que
lleva a lo que se llama representación extendida de la figura 8.4, en la que es muy
evidente la relación con la curva de la partícula libre E en función de k. Sin
embargo, se podría trasladar cualquiera de los segmentos de la curva que aparece en
la figura 8.4, a la derecha o a la izquierda, en forma paralela al eje k y a una
distancia 2mr/(a + b), en donde n es un entero y se seguirán satisfaciendo las rela-
ciones (8.3-15) y (8.3-16), ya que cualquier transformación de esta índole no varía
el valor de cos k( a + b ).
A veces es muy útil hacer una transformación particular de este tipo trasla-
dando los diferentes segmentos de la curva E en función de k a la derecha o la
izquierda, en forma paralela al eje k y a distancias que son múltiplos enteros de
2n/(a+b), de tal manera que todos queden dentro del intervalo -nf(a+b)<k<n/
(a + b). La representación resultante de la energía en función de la relaci0n de la
constante de propagación se conoce con el nombre de representación de zona redu-
cida. La representación de zona reducida de la curva de la figura 8.4 se ilustra en
la figura 8.5. En cualquier caso, se observará que las funciones de onda de Bloch
(8.2-13) satisfacen la condición de reflexión de Bragg (2.1-1) en los puntos k= nn/
(a + b ), como se vio en relación con las vibraciones mecánicas de la red de la
sección 3.3. En estos puntos, la velocidad de grupo h- 1 dE/dK es cero, correspon-
diendo a una onda estacionaria que representa a un electrón en reposo. Se puede
considerar que el electrón sufre una difracción interna por medio del potencial de
244 Teoría cuántica de los electrones en redes periódicas

dk)

_,._
O+b

Figura 8.5. Representación esquemática de la gráfica de € en función de k, de la figura 8.4,


transformada a la representación de zona reducida.

red en estas circunstancias. En una sección posterior se ampliarán los conceptos re-
lacionados con este tema.
En el cristal infinitamente grande de la sección 8.3, las energías permitidas
forman un continuo de valores dentro de las bandas permisibles. Sin embargo, si el
cristal tiene una extensión finita y contiene un total de N átomos, ya se vio, de
acuerdo con (8.2-20), que por el contrario, sólo se tendrán N estados propios permi-
sibles específicos de la cantidad de movimiento del cristal k dentro de cada banda
de energía permisible. De acuerdo con la figura 8.4, se puede ver que para una
energía dada e0 , los dos valores de cantidad de movimiento de cristal permisibles son
k(e 0 ) y - k(e 0 ). Desde el punto de vista físico, el primero representa un estado en
el que un electrón se mueve hacia la derecha con la cantidad de movimiento posi-
tivo del cristal k(e 0 ), en tanto que el segundo representa un estado en el que un
electrón se desplaza hacia la izquierda con una cantidad de movimiento del cristal
igual y opuesta. Evidentemente, la energía es la misma en ambos casos. El efecto del
espín de electrón, en este caso, al igual que en sistemas atómicos aislados, es dupli-
car el factor de degeneración asociado con todos los niveles de energía del sistema,
ya que se debe considerar que cada estado cuántico se ha dividido en dos alojando
uno de ellos a un electrón con "espín ascendente" y el otro, un electrón con ''espín
descendente". Entonces, cuando se incluye el efecto del espín electrónico, se debe
llegar a la conclusión de que dentro de cada banda de energía permisible del sistema
se tienen exactamente 2N estados cuánticos.
A una temperatura de cero absoluto, los electrones del sistema ocuparán estos
estados, uno por cada estado, como lo requiere el principio de exclusión de Pauli, a
partir del estado más bajo y en forma ascendente, hasta una energía dada que se
determina mediante el número de estados disponibles, su distribución de energía y el
número de electrones del cristal. Por supuesto, esta energía es la de Fermi del cristal
a la temperatura cero. En un cristal unidimensional, algunas de las bandas permisi-
bles estarán totalmente llenas, algunas completamente vacías y otras llenas sólo en
Representación de zona reducida; electrones y huecos 245

parte. 3 Si se aplica un campo eléctrico, es evidente que las bandas vacías no podrán
aportar ninguna corriente; sin embargo, también es cierto que no se puede obtener
una corriente de las bandas llenas. Esto se puede comprender observando que la
densidad de corriente que se produce en una banda dada será

(8.5-1)

en donde ¡:; es la velocidad promedio y n 0 el número de electrones por unidad de


volumen pertenecientes a dicha banda. No obstante, v se puede expresar como sigue

(8.5-2)

en donde la suma se toma de todas las velocidades a,.ociadas con los electrones
individuales dentro del volumen V del material. Por tanto, si se usa (8.5-2), la
expresión (8.5-1) se puede escribir como

(8.5-3)

Sin embargo, esto debe dar cero cuando se suma sobre una banda completa,
ya que debido a la simetría de las curvas de la figura 8.4 o la figura 8.5, alrededor
del eje E( k) por cada estado de velocidad positiva h- 1 aEjak correspondiente a un
punto de pendiente positiva, existe un estado correspondiente a una velocidad nega-
tiva de igual magnitud (con pendiente negativa) en k'=- k. Se debe llegar a la con-
clusión de que sólo las bandas que están parcialmente llenas pueden aportar un
flujo de corriente. Esto se comprende desde un punto de vista físico observando que
en la banda parcialmente llena existen siempre electroneo que se pueden excitar
gradualmente a estados desocupados de mayor energía y cantidad de movimiento,
mientras que en una banda llena, debido al principio de exclusión de Pauli, esta
excitación gradual de campo no puede ocurrir jamás debido a que todos los estados
están ya ocupados.
Un solo electrón en reposo en una banda vacía. ocupará el estado de energía
más bajo en la base de dicha banda, en ausencia de una excitación térmica, como se
puede ver en la figura 8.6. Si ahora se aplica un campo eléctrico E 0 al cristal, el
electrón experimentará una fuerza - eE0 y se excitará gradualmente a través de
estados de energía siempre creciente y cantidad de movimiento (negativa), adqui-
riendo una cantidad de movimiento cada vez mayor en la dirección - x, de acuerdo
con (8.4-5). De acuerdo con las predicciones de la teoría expuesta en las seccio-
nes 8.2-8.4, este proceso seguirá excitando al electrón a través de energías sucesiva-
mente más altas, hasta que llegue a la parte superior de la banda en x = rrfa, en
donde a es el espaciamiento reti~.ular. Puesto que los puntos x = rrfa y x = - rrfa son
equivalentes, se puede considerar que el electrón "reaparece" en x = rrfa, disminuyen-
do su energía a lo largo de la porción derecha de la curva conforme k va de rr/a a
cero, llegando al punto inicial en el que todo el proceso se repite. En estas circuns-
tancias, el movimiento del electrón es oscilatorio (oscilación de Zener). Es importan-
te observar que no existe un mecanismo inherente a la teoría de las seccio-
nes 8.2-8.4 que sirva para limitar este movimiento; más bien, éste continuará de un
modo indefinido de acuerdo con la teoría aquí delineada. Si el potencial fuera

3 La situación en los sistemas bidimensionales y tridimensionales es más complc1a. Fn estos


casos, la energía de diferentes bandas se puede superponer y más de una banda puede estar
parcialmente llena. Estos sistemas se estudiarán Pn detalle más adelante.
246 Teoría cuántica de los electrones en redes periódicas

r(k)

----•w+-----~~~----_,~-k
o

Figura 8.6. Un electrón que se encuentra cerca de la base de una banda permisible, sujeto a
fuerzas que tienden a acelerarlo a lo largo de la dirección -x.

perfectamente parabólico en lugar de tener la forma que se ilustra en la figura 8.6,


el electrón adquiriría una velocidad y energía ilimitadas. Entonces, se debe llegar a
la conclusión de que en cualquiera de los casos, el movimiento de un electrón libre
dentro de un potencial perfectamente periódico se realiza sin que lo impida la red,
en el sentido de que no se registran procesos de dispersión que detengan o aleato-
ricen la velocidad de un electrón, y que se relacionen con la misma
Sin embargo, si existe una desviación de la periodicidad perfecta de la red, este
resultado no se puede aplicar. En este caso existirá siempre la probabilidad de una
transición aleatoria repentina a un estado relacionado con otro valor de k dentro de
la banda. En promedio, estas transiciones aleatorias hacen que el electrón regrese a
k = O y se puede decidir que existe un proceso de dispersión asociado con el hecho
de que el potencial de red se aleja de la periodicidad perfecta. Esta desviación se
puede deber al hecho de que la red puede encontrarse a una temperatura superior al
cero absoluto, en cuyo caso las vibraciones térmicas que se establecen introducen
una leve aperiodicidad y las posiciones instantáneas de los átomos ya no coinciden
con precisión con la red periódica de sus posiciones de equilibrio. Esta situación se
puede analizar de acuerdo con una representación en la que los electrones se ven
dispersados por acción de los fonones. La desviaciones de la periodicidad pueden
causarse también por la presencia de átomos de impureza así como por vacíos de
red, átomos intersticiales dislocaciones y otros defectos estructurales de la red crista-
lina. Estos efectos dan como resultado los fenómenos de la dispersión de red, disper-
sión de impurezas y dispersión de defecto que se vieron en el capítulo anterior. El
estudio de los aspectos cuantitativos de estos procesos se pospondrá hasta un capí·
tulo subsecuente.
Estos procesos de dispersión hacen que el comportamiento de oscilación de Zener
no se presente jamás en la práctica. 4 Lo que en realidad sucede en todas las situa-
ciones experimentalmente factibles, es que un electrón que principia en O de la
figura 8.6, se acelera como lo describe la teoría de las secciones 8.2-8.4, hasta que
llega a un punto A a una pequeña distancia a lo largo de la porción parabólica
inferior de la curva. Su compartimiento en este rango es el de un electrón libre de
masa m*, como lo establece (8.4-8). En el punto A se ve dispersado por uno de los
mecanismos antes descritos, llegando en promedio nuevamente a O, en donde se

4 Se puede encontrar un estudio cuantitativo de la oscilación de Zener en E. Spenke,


Electronic Scmiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958), páginas 229, 257.
Representación de zona reducida; electrones y huecos 247

repite el ciclo. Entonces, el comportamiento es el de una partícula libre sujeta a


procesos de dispersión que se acaban de ver en el último capítulo, lo cual conduce a
la ley de Ohm, la conductividad térmica, el efecto termoeléctrico y todos los demás
resultados de la teoría del electrón libre de los metales, y la única diferencia es que
la masa del electrón se substituye por la masa efectiva en todos los procesos. La
distancia OA de la curva de e en función de k, de la figura 8.6, se ha exagerado
para facilitar la comprensión; pero en la mayoría de los casos que se presentan en la
práctica es mucho más pequeña.
Para una banda que contiene un número relativamente pequeño de electrones,
la corriente obtenida cuando se aplica un voltaje pequeño está dada por (85-3)
sumada sobre todos los electrones de la banda. Sin embargo, si la banda está casi
llena y se tienen sólo unos cuantos estados vacíos (que en el estado de equilibrio se
concentran cerca de la parte superior de la banda), 5 la ecuación de la corriente
(8.5-3) se expresa mejor escribiéndola en la forma

(8.5-4)

En este caso, la suma sobre i representa la adición sobre todos los estados de
velocidad ocupados por los electrones, la suma sobre ¡ representa la adición sobre
todos los estados de velocidad dentro de la banda y la suma sobre k representa la
adición sobre todos los estados de velocidad desocupados. Como se vio antes en
relación con (8.5-3), la suma sobre j, tomada sobre todos los estados de la banda, debe
desaparecer. La suma restante sobre los estados desocupados corresponde a una corrien-
te que podría producirse por un número correspondiente de portadores de carga po-
sztivos. Se puede (y es conveniente, como se verá más tarde) expresar la corriente de una
banda casi llena, como derivada del movimiento de un número comparativamente peque-
ño de estados electrónicos vacíos o huecos, que se comportan corno partículas positivas,
más que mediante un gran número de electrones. La velocidad asociada con un
hueco es la que tendría un electrón si ocupara un estado de energía vacío que
normalmente se encuentra en la parte superior de la banda de energía. Sin embargo,
puesto que la relación de e en función de k es cóncava hacia abajo, d 2 ejdk 2 es
negativa y da una masa electrónica efectiva negativa a partir de (8.4-8). Una par-
tícula con masa efectiva negativa experimenta una aceleración en una dirección
opuesta a la de la fuerza aplicada. Una partícula negativa con una masa efectiva
negativa entonces se acelerará en la misma dirección que el campo aplicado y presen-
tará el mismo comportamiento dinámico que una partícula positiva de masa positiva.
Por tanto, la situación de una banda casi llena se puede considerar como un caso en
que se abarca un número relativamente pequeño de partículas positivas de masa
positiva, que se designará como huecos, cuyas velocidades y cantidades de movi-
miento corresponden a los estados electrónicos desocupados dentro de la banda. En
un capítulo posterior se verá que en ciertos materiales, la naturaleza física y el
comportamiento dinámico de los huecos se comprenden con más facilidad relacionán-
dolos con los defectos en los enlaces electrónicos de valencia que unen a los átomos
más cercanos y proporcionan las fuerzas de cohesión que mantienen unido al cristal.

S En una banda parcialmente vacía, los electrones ocupan los estados de energía más bajos
disponibles en ausencia de una excitación térmica. Esto es aplicable también a la banda casi
llena, en donde el resultado es que los estado vados se localizan en la parte superior de la
banda. Por tanto, en una banda casi completamente llena, los estado~ vacíos '·gravitan" ascenden-
temente en un diagrama como el de la figura 8.5, en el que la ordenada representa la ener~ía de
un electrón.
248 Teoría cuántica de los electrones en redes periódicas

No se analizará detalladamente el comportamiento de los electrones y los huecos


bajo la influencia de la fuerza magnética; pero se puede demostrar6 que se mueven
como lo harían partículas negativas o positivas de masa efectiva m*, según lo que
establece (8.4-8), bajo la influencia de la fuerza magnética normal q(v x B)/c.

8.6 LA APROXIMACION DEL ELECTRON LIBRE

En las secciones anteriores se vio cómo un modelo particular de potencial


periódico (que se ilustra en la figura 8.2) condujo a la formación de bandas de
energía permisibles y a una relar;ión de e en función de k de la forma que aparece
en la figura 8.4. La forma de esta relación fue tal que la cantidad hk se podí::.
considerar ventajosamente como una "cantidad de movimiento del cristal" en cuyos
términos se podía explicar de un modo sencillo la dinámica de los electrones en los
campos de fuerza aplicados. La representación resultante del comportamiento elec-
trónico fue muy similar al del electrón libre del capítulo 7, excepto que la masa del
electrón libre se substituía por una masa efectiva y que los portadores de carga en
una banda casi llena tenían que considerarse como huecos positivos. Se dio énfasis al
hecho de que estas conclusiones cualitativas son independientes de la forma precisa
de la función de potencial, siempre y cuando sea periódico; se adoptó la función de po-
tencial de la figura 8.2 sólo con fines ilustrativos, ya que permitía una solución exacta
de la ecuación de Schrodinger.
En cristales reales, la función de potencial que se utiliza debe estar relacionada
de .algún modo con el potencial real experimentado por un electrón, debido a los
núcleos iónicos y a todos los demás electrones del cristal. Una solución exacta de
este problema, incluso en la aproximación de un sólo electrón, sería imposible de
lograr, por tanto, se acostumbra a plantear el problema desde el punto de vista de la
aproximación del electrón libre o la aproximación de enlace firme, cualquiera que
sea el más apropiado para la situación particular de que se trate.
En la aproximación del electrón libre, se supone que la energía total del
electrón es siempre grande en comparación con la energía potencial periódica. En
estas condiciones, las bandas permisibles serán anchas y las regiones de energía prohi-
bida muy angostas. Estas circunstancias nunca se realizan a la perfección en cristales
reales, dado que el potencial va siempre a - oo en los núcleos iónicos; pero para los
electrones más externos de muchos metales simples, incluyendo los alcalinos, los
requisitos se satisfacen aceptablemente en casi todo el volumen del cristal.
Si se adopta un modelo de potencial cristalino unidimensional para una mayor
facilidad, y el potencial periódico V(x) se escribe en la forma

(8.6-1)

en donde f(x) tiene la periodicidad de la red, la ecuación de Schrodinger (8.3-1) se


puede escribir como sigue

d 2 ~ +(k~+ yf(x))rf¡(x) =O. (8.6-2)


dx

6 R. A. Smith, Wave Mechanics o[ Crystalline Solids, John Wiley and Sons, Nueva York
(1961, página 458)
La aproximación del electrón libre 249

en donde k 0 está relacionada con la energía total e por medio de

(8.6-3)

Puesto que f(x) es periódica, se puede expresar como una serie de Fourier de
la forma
00

f<x>= ¿ c.e-2"i•xta (8.6-4)


n=- oo

siendo
c.= ~fa f(x)e2"inx/a dx, (8.6-5)
a o

en donde a es la constante de red del cristal. De acuerdo con (8.6-1), es evidente


que los coeficientes Cn se relacionan con los coeficientes de expansión de Fourier
del potencial periódico propiamente dicho a través de

(8.6-6)

en donde Vn se relaciona con los coeficientes de expansión de Fourier de V(x).


Puesto que las funciones de onda deben tener la forma de Bloch eikxuk(x), y,
dado que uk(x) debe ser una función periódica con un periodo a, expresable como
una serie de Fourier, se puede escribir

00

uk<x> = ¿ b.e-2"i•x/a (8.6-7)


n=- oo

tf¡(x) = eikxuk(x) = eikx ¿ b.e-2ninx/a. (8.6-8)



Para electrones perfectamente libres, -y= O y las soluciones se convierten en
funciones ondulatorias de partícula libre de la forma

(8.6-9)
En este límite uk(x) ~ b 0 y k~ k 0 , de tal modo que en el caso general, se
debe esperar que todos los valores de bn, excepto b 0 , se acerquen a cero conforme
-y tiende a cero. En consecuencia, se puede escribir una expresión aproximada para
la función de onda de la forma

(8.6-10)

que puede esperarse sea válida para valores pequeños de -y (es decir, para las condi-
ciones delineadas antes y de acuerdo con las cuales la aproximación del electrón
libre es válida). Es fácil ver que esta función de onda tiene la forma de Bloch, en
donde uk está dada por

uk<x> = bo +Y¿ b.e-2"i•xla. (8.6-11)


... o
250 Teoría cuántica de los electrones en redes periódicas

Al substituir (8.6-10) en la ecuación de Schrodinger (8.6-2), se obtiene

bo(k~ - k 2 )eik:J: + y L [(k~ - k~)b,. + b0 c,.]eik"x


.... o

(8.6-12)

en donde
k =k_ 2nn (8.6-13)
n
a

Puesto que el interés reside en la solución dentro del límite en donde 'Y-+ O,
como primera aproximación se puede hacer caso omiso del término -y 2 de ( 8.6-12);
entonces, multiplicando la ecuación completa por e-ikmx, integrando sobre la célula
unitaria desde x = O hasta x = a, se tiene que

b 0 (k~ - k 2 ) fa e2"imx/a dx + y L {[(k~ - k~)b,. + boc,.]


o .... o

X fa é"i(m-n)x/a dx} =O. (8.6-14)


Jo
Si m = O, la segunda integral desaparece para todos los valores de n en la
suma, por lo cual

or (8.6-15)

mientras que si m =1= O, la primera integral se desvanece y la segunda da cero, excep-


to cuando n = m, en cuyo caso se obtiene

o bien,
(8.6-16)

Entonces, a este orden de aproximación, de acuerdo con (8.6-15) y (8.6-3), la


relación entre e y k es la misma que la de una partícula libre. La función de onda
se obtiene substituyendo los valores (8.6-16) en lugar de bn en (8.6-10), de donde.

(8.6-17)

De acuerdo con (8.6-15) la corrección de primer orden para la energía de


partícula libre que se origina desde el potencial periódico es cero. La corrección de
energía de segundo orden se puede obtener reteniendo el término 'Y2 en (8.6-12). Al
multiplicar (8.6-12) por e-ikx e integrando desde x =O a x =a, se obtiene

(8.6-18)
La aproximación del electrón libre 251

La primera integral anterior es cero para todos los valores permisibles de n, en


tanto que la segunda integral es cero a menos que n =- n'. Por tanto, la ecuación
se reduce a

(8.6-19)

Si f(x) está dada como una serie de Fourier por medio de (8.6-4), entonces, al
substituir n por - n,
00
f(x) = :¿ c_"e2ttinxta, (8.6-20)
n=- oo

en tanto que, tomando el conjugado complejo de ambos lados de (8.6-4) y obser-


vando que puesto que f(x) es una función real, .f'(x) = f(x) se puede escribir tam-
bién

00
f<x> = :¿ c:e2ninxta. (8.6-21)
n=-oo

Puesto que los coeficientes de Fourier asociados con la representación de una


función dada son únicos, se debe tener

(8.6-22)

Usando la expresión de la primera aproximación (8.6-16) para los coeficientes


bn y la relación (8.6-22), la expresión (8.6-19) se puede escribir en la forma

(8.6-23)

Si se usa (8.6-3) y (8.6-6) para expresar este resultado en función de e y Vn,


se puede demostrar fácilmente que

(8.6-24)

Estas soluciones son satisfactorias sólo a condición de que k 2 no se acerque


a uno de los valores k~. Si k 2 ~k~ para algún valor de n, una de las cantidades
k 2 - k~ de los denominadores de los términos de suma de (8.6-17) tenderán a cero
y dicho término seguirá siendo muy grande a pesar de que r sea muy pequeño. En
este caso, la expresión supuesta (8.6-1 O) no es una buena aproximación para la
función de onda y se debe emplear otra forma. Entonces, si k 2 ~k~,

2nn
k = ± kn = ±k :¡: - . (8.6-25)
a
252 Teoría cuántica de los electrones en redes periódicas

Para el signo superior, esta ecuación da n =O, que se excluye de (8.6-17) en


cualquier caso y, por ende, no tiene ningún interés particular. Para el signo inferior
se obtiene

k= mt (8.6-26)
a

que, puesto que n puede tomar valores positivos y negativos, se refiere a todos los
puntos de borde de la banda. Será necesario utilizar un planteamiento por separado
para valores de k en las cercanías de estos puntos.
Supóngase ahora que k~ mrfa, de donde kn =k- (2rrnfa) ~- nrrfa. Por tanto,
k~~ k 2 y bn será muy grande de tal modo que en (8.6-17) la cantidad rbn ya no
será pequeña aunque r sea pequeña. En este caso se puede escribir la función de
onda aproximadamente como

(8.6-27)

considerando que los otros términos de la suma de (8.6-17) son despreciables en


comparación con el nésimo. Puesto que kn = - k en el borde de la banda, esta función
de onda (8.6-27) es una superposición de una onda que se propaga a lo largo del eje po-
sitivo x y otra que se propaga en dirección opuesta; por tanto, tiene el carácter de
una onda estacionaria. Esta situación física concuerda con el punto de vista de que la
función de onda del electrón sufre una reflexión de Bragg en k = ± mrfa. Si la fun-
ción de onda (8.6-27) se substituye en la ecuación de Schrodinger (8.6-2), utilizando
(8.64), se obtiene

Al multiplicar (8.6-28) por e-ikx y al integrar desde x =O hasta x =a, se


puede ver fácilmente que los términos segundo y tercero no contribuyen con nada y
que se obtiene una contribución del cuarto término sólo cuando n' = - n; el resul-
tado final de esta operación es, entonces,

De igual manera, al multiplicar (8.6-28) por e-•k"x = e


· "")x
-i(k- 2
a e integran·
do como antes, se puede demostrar que

Las dos ecuaciones anteriores se p01eden considerar como un conjunto de ecua-


ciones homogéneas que determinan a b 0 y bn. Como tales, las soluciones diferentes
a bo = bn =O existen sólo si desaparece el determinante del sistema, es decir, sólo si

1
k o2 - k2 y 2 c.* 1- 2 2 2 2
k2 _ k2 - (ko - k )(k 0 -k.)- y c. c.= O.
2 * (8.6-31)
1 c. O n
La aproximación del electrón libre 253

Esta ecuación es cuadrática en k~ y se puede resolver en la forma acostum-


brada para dar

(8.6-32)

que, utilizando {8.6-3), (8.6-16) y {8.6-13), se puede expresar como sigue

2
s(k) = 4ñm [ k 2 2nn) ±
+ ( k - --¡;-
2
J( ( k2 - k- 2nn)
--¡;-
2 2
) + (4miY.I)
-¡;r 2
] . (8.6-33)

En el borde de la banda k =k 71 = mrfa, y, en estos puntos, (8.6-33) se reduce a

(8.6-34)
en donde
Bn =~ (~) 2
2m a
(8.6-35)

representa la energía de partícula libre asociada con los puntos de borde de la


banda.
De acuerdo con los resultados de la sección 8.3, se sabe que en los puntos de
borde de la banda k=± mrfa, se produce una reflexión interna de Bragg que va
acompañada de una discontinuidad o "vacío de energía" en la curva de e en función
de k. 7 De acuerdo con esto, debe interpretarse que la ecuación (8.6-34) implica un
vacío de energía o banda prohibida con una anchura 21Vn l, en donde Vn es el
nésimo coeficiente de Fourier en la expansión de serie de Fourier del potencial reticular
periódico. Para valores de k de una magnitud mayor que mr/a se debe esperar que e(k)
sea mayor que el valor dado por (8.6-34) y que se acerque al valor del electrón libre pre-
dicho por (8.6-15), en donde k 2 difiere de k~ en una cantidad que puede hacer que 'Yhn
sea lo suficientemente pequeña de tal modo que el método que conduce a las ecuaciones
(8.6-1'6) y (8.6-24) sea legítimo. De igual manera, para valores de k con una magnitud
menor que mrfa, se puede esperar que e(k) sea menor que el valor dado por (8.6-34) y
que nuevamente se acerque a soluciones antes obtenidas, cuando k 2 difería de k~ por
una cantidad suficiente. Estas condiciones quedarán satisfechas si en (8.6-33) se
escoge el signo más para k> mr/a y el signo menos para k< mrfa. La solución
(8.6-15) o la segunda aproximación (8.6-24), que es mejor, en las regiones entre los
bordes de banda, junto con la solución (8.6-33) para las regiones cercanas a los
bordes de banda (los signos se seleccionan como se describió antes) conducen a una
relación entre e y k como la que se ilustra en la figura 8.7.
De acuerdo con esta figura, parece ser que las curvas de e en función de k son
aproximadamente parabólicas cerca de los puntos de borde de la banda. La masa
efectiva se puede establecer a partir de (8.4-8) mediante la derivación directa de
(8.6-33). Estos cálculos son muy elaborados y es más fácil proceder haciendo que

nn
k=-+k', (8.6-36)
a

7 El hecho de que la velocidad de grupo del electrón, en efecto es cero en estos puntos
como es de esperarse para las ondas estacionarias que se asocian siempre con la reflexión de
Bragg, se puede demostrar a partir de (8.6-33); los detalles de esta corroboración se les asignan
como ejercicio al lector.
254 Teoría cuántica de los electrones en redes periódicas

c(k)

-.,. .,.
o o

Figura 8.7. Representación esquemática de la relación € en función de k para la aproximación


del electrón libre, tal y como se obtiene a partir de (8.6-24) y (8.6-33)

en donde k' es pequeña en comparación con rr/a, en (8.6-33). Thspués de efectuar


algunas operaciones algebraicas, (8.6-36) se puede escribir en la forma

e( k)
2
1i
= 2m [(mt) 2+ k'2 + hl
-;;
mAe ~(n1t)2( 1i 2 )2]
\) + 4k'\-;; mAe1 (8.6-37)

en donde
Ae = 21V.I (8.6-38)

representa la anchura de la región de energía prohibida en k= nrr/a. Para puntos


cercanos al fondo de la banda superior, k' es muy pequeña y el radical de (8.6-37)
se puede expandir mediante el teorema del binomio que da, aproximadamente,

e(k) = e.
1 2
li k' (
+- Ae + - - 1+
2
4e)
A n ' (8.6-39)
2 2m Lle,

en donde En está dada por (8.6-35). Después de derivar dos veces y usar (8.4-8), es
evidente que
li 2 li 2 m
(8.6-40)
m* = d 2efdk 2 = d 2efdk' 2 = 1 + 4e. ·
Ae
Se puede demostrar de una manera similar que la masa efectiva para huecos
crrcanos a la parte superior de la banda inferior, es la misma que el valor de los
ele e trone~ dado por ( R.6-40).
La aproxifTIIlción del enlace firme 255

8.7 LA APROXIMACION DEL ENLACE FIRME

En la aproximación del electrón libre, la energía potencial del electrón se


supuso pequeña en comparacwn con su energía total. Esto condujo a un plantea-
miento aproximado en el que se encontraron bandas de energía prohibidas y permi-
tidas, y en donde la anchura de las bandas prohibidas era pequeña en comparación
con la de las bandas permitidas en el límite en el que se satisfacía la suposición
inicial. La aproximación del enlace firme parte de un punto de vista contrario, esto
es, que la energía potencial del electrón representa casi toda la energía; en este caso,
las bandas de energía permitidas son angostas en comparación con las bandas prohi-
bidas. En el modelo del electrón libre se supone que los átomos del cristal están tan
cerca unos de otros que las funciones de onda de los electrones de átomos circun-
vecinos se superponen en gran parte. Por tanto, existe una fuerte interacción entre
los átomos cercanos, y los estados de energía permisibles del cristal resultante tienen
muy poco parecido con las funciones de onda atómicas de los átomos individuales
de los que se compone el cristal. Sin embargo, la aproximación de enlace firme se
basa en la suposición de que los átomos del cristal están tan separados que la
función de onda de los electrones asociados con átomos vecinos se superponen sólo
en menor grado. La interacción entre átomos cercanos será relativamente débil en
este caso, y las funciones de onda y los niveles de energía permisibles de todo el
cristal estarán íntimamente relacionados con las funciones de onda y los niveles de
energía de los átomos aislados. Por supuesto, la pregunta de cuál de las dos aproxi-
maciones es correcta para una situación dada, depende del material particular de que
se trate. En algunas substancias, la aproximación del electrón libre es muy apropiada,
en tanto que en otras, la aproximación del enlace firme es mucho más correcta.
Existen también cristales para los que ninguna de ellas es adecuada ya que se trata
de una situación intermedia entre estos dos casos extremos.
Las funciones de onda del cristal en la aproximación del enlace firme se basan
en las funciones de onda de átomos aislados. Si la función de potencial relacionada
con un átomo aislado es V0 (r), entonces la solución de la ecuación de Schródinger

(8.7-1)

representa las funciones de onda electrónicas del átomo. Supóngase que la función
de onda de estado basal 1/1 0 no está degenerada y corresponde a una energía de
estado basal e0 • Si un gran número de átomos de este tipo se combinan en una red
periódica, de tal manera que el valor del potencial en las regiones que rodean a cada
átomo individual en donde la función de onda de estado basal es grande, no se ve
muy afectada por la presencia de los átomos vecinos, la función de onda del cristal
(por lo menos para estos estados de enlace más firme) se puede escribir como una
superposición lineal de funciones de onda atómicas de la forma

t/J(r) = L: ant/JoCr - r"), (8.7-2)


n

en donde los vectores r y r n se relacionan tal y como se indica en la figura 8.8. La


suma se toma sobre todos los átomos del cristal que, para mayor facilidad, se
supondrá que tienen una extensión infinita. Puesto que todos los átomos del cristal
son equivalentes, todos los coeficientes an deben tener el mismo valor absoluto; por
tanto, deben poder expresarse en la forma aél>n, en donde a y cf>n son cantidades
reales. Por la misma razón, la diferencia de fase cp entre cada par de átomos cerca-
256 Teoría cuántica de los electrones en redes periódicas

• • p • • •
• •
• •
• •

o • •

Figura 8.8. Geometría vectorial usada en el cálculo de la sección 8.7.

nos a lo largo de cualquier eje cristalino dado, debe ser la misma (aunque no
necesariamente es idéntica a lo largo de los tres ejes). Esto conduce a la selección
del factor de fase tPn = k • rn en donde k es un vector constante. Por último, si las
funciones 1/1 0 están normalizadas de tal modo que su integral tomada sobre todo el
espacio es la unidad y, si se desea conservar esta normalización, se debe tomar
a= l. En consecuencia, (8.7-2) se debe escribir en la forma 8

t/lk(r) = L eik-r"t/1 0(r - rn)· (8.7-3)


n

Estas funciones de onda satisfacen la ecuación de Schrodinger para todo el


cristal, con la función de potencial periódica de la figura 8.9, esto es,

(8.7-4)

El operador hamiltoniano total :Yf se puede escribir como la suma de dos


partes,

(8.7-5)

Potencial
1
r = rn

Figura 8.9. Funciones de potencial utilizadas en los cálculos de la sección 8.7.

8 Se puede demostrar que la ecuac10n (8.7-3) tiene la forma de una función de Bloch
semejante a (8.2-14). Los detalles de esta comparación se asignan como ejercicio.
La aproximación del enlace firme 257

siendo

(8.7-6)

y
(8.7-7)

De acuerdo con (8.7·1), es evidente que Jff ot/Jo = e0 ¡J; 0 , por lo cual, utilizan-
do (8.7-3),

J'f ot/lk = L eik '•Jff ot/lo(r- rn) =BoL eik '"t/lo(r- rn) = Bot/Jk· (8.7-8)
n n

Ahora, de acuerdo con (4.14-5), la energía e se puede encontrar determinando


el valor esperado del operador hamiltoniano, de donde, usando (8. 7-5) y (8.7-8),

f t/I:(Jffo + Jff')t/lk dv ft/lt L eikr"[V(r) -- V0 (J- rn)Jt/10(r- rn) dv

•~. ffN,ao ~•,+. . f.•N.d•


(8.7-9)

A condición de que se haga caso omiso de la pequeña superposición de las


funciones de ondas atómicas centradas en diferentes puntos de la red, las propieda-
des de normalización de las funciones t/Jo y la defmición (8.7-3) requieren que
i t/Jkt/Jk dv sea igual a .V, es decir, el número de átomos dE'l cristal. Si se usa este
hecho y se substituye el valor dado por (8.7-3) en lugar de t/Jk en el numerador de
(8.7-9), se obtiene

e= 60 + _!_ L \(L eik (r.-r,.)


N n m
J
v
t/JÓ(r- rm)[V(r)- V0(r- rn)]t/1 0(r- rn) dv}. (8.7-10)

Se verá que, debido a la periodicidad del cristal y a causa de la suma sobre todos
los valores de m, cada término de la suma sobre n da el mismo valor. El valor de la
suma sobre 11, por tanto es el valor de cualquier término de la suma (por ejemplo,
para mayor claridad, aquel para el que n = O) multiplicado por el número de tér-
minos de la suma, que es N En consecuencia, (8.7-10) se puede escribir como sigue

e( k)= e + Le- ik '"'


0
m
I v
t/ló(r- r"')[V(r)- V0(r)]t/1 0(r) dv, (8.7-11)

en donde la suma se toma sobre todos los átomos del cristal. Sin embargo, puesto
que la función de onda t/1 0 desciende casi siempre de un modo muy rápido con
respecto a la distancia y, puesto que las magnitudes de las integrales de (8.7-ll)
están gobernadas esencialmente por la cantidad de superposición entre dos funciones
de onda centradas en átomos separados por distancias r m, las contribuciom.s de los
términos de la suma se reducen con gran rapidez conforme aumenta rm. Por tanto,
generalmente se tiene como buena aproximación al considerar sólo los ténninos del
vecino más cercano. De acuerdo con esto, se hará caso omiso de todos los térn;inos
258 Teoría cuántica de los electrones en redes periódicas

que se relacionan con las contribuciones que van más allá de la del vecino más
cercano en (8.7-11). También se supondrá que las funciones de onda 1/Jo son es[é·
ricamente simétricas; en estas condiciones, todas las aportaciones del vecino más
cercano serán idénticas. En consecuencia, este método se reduce al caso en el que la
configuración electrónica de estado basal en el átomo aislado es la de un estado s
como es, por ejemplo, para los metales alcalinos, aunque la extensión a los estados p
es lo suficient~::mente directa y puede lograrse sin grandes problemas. 9
Para el caso m= O, la integral de (8.7-11) se convierte en

J.l/ló(r)[V(r)- V0 (r)]if¡ 0 (r) dv = -oc, (8.7-12)

mientras que, para los átomos más cercanos,

(8.7-13)

en donde rm es un vector que relaciona al átomo en el origen con el átomo vecino


más cercano. Puesto que el cálculo real de las integrales de superposición es mu}
complicado sólo se indicarán aquí los resultados en término de las cantidades que se
definieron antes como -a: y - {3. En estas circunstancias, la ecuación (8.7-11) se
puede escribir como sigue

e(k) = Bo -oc- f3 L e-ik •m, (8.7-14)


m

en donde la suma sólo considera los átomos más cercanos. En ei caso de un cristal
cúbico simple, las componentes del vector rm se pueden expresar como

rm = (±a,O,O), (O,±a,O), (O,O,±a), (8.7-15)

en donde a es la constante de red. La ecuación (8.7-14) da, entonces,

e(k) = e0 -oc- 2{3(cos kxa + cos kya + cos kza). (8.7-16)

De acuerdo con esta ecuación, es evidente que existe un rango de valores de


energía permisibles correspondientes a varios valores que pueden tener kx, k y y kz.
Los estados permisibles forman una banda de energía más o menos en la misma
fom1a en que sucede con las que se vieron en relación con la aproximación del
electrón libre.
De acuerdo con (8.7-16), el valor mínimo de la energía está en kx =kv=
kz =O en ese punto, es decir, en el origen de una gráfica con coordenadas ortogo·
nales (kx, k y, kz) en el espacio k. Los valores máximos se producen en los vértices

de un cubo dentro del espacio k cuyas coordenadas son ( ± ~.


± ~. ± ~). en don·
a a a
de todas las permutaciones de los signos 1- y -- entre las tres coordenadas se toman

9 Véa~e, por ejemplo, N 1· Mnlt y 11. Jones, Theory o[ Metals and Alloys, Dover Publica-
llon~. Nuev.1 York (1958), página 70.
La aproximación del enlace firme 259

para generar ocho puntos de los vértices. En estos sitios cada término de coseno
toma el valor - l. La diferencia de energía entre los puntos de energía máxima y
mínima es, de acuerdo con (8.7-16), 12 (3. Esta es la anchura de la banda de energía
correspondiente al estado s del átomo aislado. Si los átomos vecinos más cercanos están
muy separados, la superposición de las funciones de onda 1/; 0 (r) y 1/; 0 (r- rm), como
lo expresa el producto 1/; 0 (r)V; 0 (r- rm) en la integral (8.7-13), se hace muy pequeño
como sucede con el valor de {j según lo establece dicha ecuación. En el límite don-
de las distancias atómicas se hacen grandes (y es en este límite en donde son real-
mente adecuadas las aproximaciones en las que se basan los cálculos de enlace
firme), las bandas de energía permisible se hacen angostas acercándose a un solo
valor de energía discreta, correspondiendo al nivel energético del estado atómico s
conforme la separación se hace infinita. Esta variación de la anchura de banda con
el espaciamiento atómico se ilustra esquemáticamente en la figura 8.1 O

Niveles
Bandas atómicos
permitidas

Distancia
ES::>---------+- interatómica o
" • Espaciamiento o: 00

de equilibrio

Figura 8.10. Representación esquemática de la divhión de los niveles discretos de energía ató-
mica en bandas, conforme los átomos aislados se combinan en una red cristalina.

Para un electrón que se mueve en la dirección x, ky = kz =O. Si la cantidad


de movimiento es lo suficientemente pequeña de tal manera que kx ~ rrfa, el elec-
trón estará cerca de la base de la banda de energía. En estas condiciones, al aproxi-
mar el cos kxa en (8.7-16) mediante los dos primeros términos de su expansión de
serie, (8.7-16) se convierte en

(8.7-17)

Esto muestra que la relación E en función de kx es parabólica y que, por


tanto, el electrón se comporta básicamente como si fuera libre. Como siempre, la
cantidad llkx se puede interpretar como la componente x de un vector de cantidad
de movimiento del cristal p = llk. La masa efectiva está dada por

(8.7-18)
260 Teoría cUIÍntica de los electrones en redes periódica

De acuerdo con la simetría de la ecuación (8.7-16), es obvio que la masa


efectiva asociada con el movimiento en las direcciones y y para todas las cantida-
des pequeñas de movimiento, será la misma que la que se dio en (8.7-18) y, por
tanto, la masa efectiva es isotrópica o independiente de la dirección. No obstante,
no siempre sucede así, sobre todo en cristales no cúbicos; la masa efectiva en este
caso es anisotrópica con frecuencia, y debe considerarse como un tensor. Este punto
se verá más detalladamente en la siguiente sección. De acuerdo con (8.7-18), parece
que conforme aumenta la distancia reticular a, disminuye la masa efectiva; sin em-
bargo, lo que sucede es exactamente lo contrario, ya que conforme aumenta a, la
integral de superposición {3 disminuye con mucha mayor rapidez, de tal manera que
el producto {3a 2 disminuye rápidamente al incrementarse las distancias reticulares. Por
tanto, de acuerdo con (8.7-18), en el límite extremo del enlace firme, un electrón se
hace muy "pesado", lo c~al constituye una expresión del hecho de que, en estas
circunstancias, no se transfiere fácilmente de un átomo a otro.

8.8 DINAMICA DEL ELECTRON EN ESTRUCTURAS


BIDIMENSIONALES Y TRIDIMENSIONALES;
SUPERFICIES DE ENERGIA CONSTANTE
Y ZONAS DE BRILLOUIN

En esta sección se verá minuciosamente el comportamiento de los electrones en


redes periódicas bidimensionales y tridimensionales, utilizando siempre que se p_ue_da
el ejemplo del cálculo de la aproximación de enlace firme para la estructura cubica
simple, como ilustración de los principios generales en cuestión. Es evidente. que las
ecuaciones dinámicas de la sección 8.4 se pueden ex tender de un modo duecto a
una situación bidimensional, en cuyo caso se obtiene

(8.8-1)

para la velocidad del electrón, en donde Vk se refiere al operador gradiente en el


espacio ortogonal k cuyas coordenadas son (kx, ky, kz). Por tanto, se puede escribir

(8.8-2)

Si A es un vector cuyas componentes son las funciones de kx, ky y kz, cada


componente A~ (o:= x, y, z) debe satisfacer la relación

dA~= oA. dkx + iJAa '!_~ + iJA, dkz =(V kA). dk. (8.8-3)
dt okx dt oky dt okz dt ~ dt

El vector dA/dt, entonces puede expresarse, como el producto escalar del ten-
sor10 Vk A y el vector dk/dt, de donde,

dA dk
- - = (VkA) • -- (8.8-4)
dt dt '

lO t·:n l'l ¡1péndice B ~r incluye una hreve de~cripción del análisis ten~orial que se requiere
p.1ra l'ntrnder lo~ conccptm expucstm en este hhro.
Dinámica del electrón, superficies de P-nergía y zonas de Brillouin 261

cada componente del producto tensorial anterior conduce a una ecuación de la


forma (8.8-3). Al aplicar esta fórmula a (8.8-3), si se hace que k= p/h, se obtiene

(8.8-5)

Esta ecuación es básicamente la ecuación de fuerza de Newton dvg/dt = F/m*.


Sin embargo, es obvio que la recíproca de la masa efectiva es un tensor de la forma

(8.8-6)

Los elementos de este tensor son, claramente,

oe 2
(8.8-7)
li 2 okaokp'

lo cual demuestra que el tensor de masa efectiva recíproca es simétrico, es decir,


que

(1/m*)pa = (1/m*)afJ• (8.8-8)

En general, se debe considerar que la masa efectiva es un tensor debido a que


la curvatura de la relación e(k) no es necesariamente la misma a lo largo de todas
las direcciones posibles dentro del espacio k; en consecuencia, es posible que se
tenga una masa efectiva diferente para cada dirección posible.
Para el cristal cúbico s1mple de la sección 8. 7, para valon:s ka ~ 1, la ecua-
ción (8.7-16) se puede escribir en la forma

(8.8-9)

Esto permite ver que todos los elementos que están fuera de la diagonal del
tensor de masa efectiva (8.8-7) son cero, y que cada uno de los elementos sobre la
diagonal es igual a h2 /2{3t:z2, por lo cual el tensor se reduce a h2 /2{3a 2 por el tensor
unitario [Da¡¡]. La masa efectiva es claramente isotrópica en estas circunstancias y
puede representarse como la cantidad escalar h2 /2{32, lo cual concuerda con las
conclusiones de la sección anterior.
A continuación se investigará la forma de las superficies de energía constante
en el espacio k, para la estructura cúbica simple que se vio en la aproximación de
enlace firme en la sección anterior. La e~uación de estas superficies sencillamente es
(8.7-16) en donde e(k) se considera como una constante paramétrica. En relación
con (8.7-16) se mencionó que el valor mínimo de e se obtenía en el punto kx =
ky = kz = O, en donde todos los términos de coseno alcanzan el valor de la unidad.
Para valores de e ligeramente mayores que este mínimo, los cosenos deben estar
cerca de la unidad y, por tanto, los argumentos kxa, kya y kza deben ser todos muy
pequeños. En este caso, (8.7-16) se reduce a la forma antes indicada como (8.8-9),
que se puede reacomodar ligeramente para dar

2 2 2 e(k) e0 - oc - 6/3
kx + k, +k. = f3a 2 - {3a 2 = consl. (8J~-10)
262 Teoría cutintica de los electrones en redes periódicas

Evidentemente, esta es la ecuación de una esfera dentro del espacio k. La


forma esférica de todas las superficies de energía constante revela que los electrones
de esta región del espacio k se comportan como electrones libres; se observará en
(5.2-18) que, para partículas libres, es esférica la superficie de energía constante en
el espacio de la cantidad de movimiento. Conforme aumenta el valor de e, el radio
de la superficie esférica de energía constante también aumenta hasta que los valores
de k asociados con los puntos sobre la superficie se hacen tan grandes que la
aproximación ka < 1 ya no sigue siendo válida. En este caso, se debe usar la ecua-
ción más general (8.7-16) para graficar las superficies de energía constante y, confor-
me aumenta e, las superficies que se obtienen son como se ilustra en la figu-
ra 8.11(a-f). Al incrementarse e, la esfera se expande, se distorsiona un poco, como
sucede en (b) y en e= e 1 + 413 (en donde e 1 es el valor de e en el punto mínimo o
e0 -a- 613) adquiere una furma casi octohédrica como la que se presenta en (e).
En este punto, la superficie de energía toca el cubo limitante, cuyo lado es 2rr/a,
sobre el cual se hablará más tarde. Conforme e aumenta más todavía, la superficie
adquiere la forma que se ilustra en (d), y cuando e= e 1 + 813 adquiere la forma que
aparece en (e). En este punto la superficie se divide en ocho hojas. cada una de las
cuales se acerca al vértice del cubo conforme e tiende a su valor máximo para la
banda e1 + 12/3. Estas ocho ramas tienen una forma aproximada de octantes de una
esfera en el límite en que e se acerca a su valor máximo. La superficie de energía
constante tiene siempre una simetría cúbica en este ejemplo. Las intersecciones de la
superficie de energía constante con el plano kxky se ilustran en la figura 8.12. Se
puede considerar también que estas curvas son las de energía constante correspon-
dientes a un cristal bidimensional con una red cuadrada cuyo espaciamiento interató-
mico es a. De acuerdo con (8.7-16), es evidente que todos los estados dentro de la
banda deben tener una energía entre e 1 y e 1 + 12/3, y que todos los estados posibles
dentro de este rango de energía están representados por los valores de (kx, ky, kz)

que quedan dentro de los límites ( ± -,


1t
± -,
1t
± 1t)
- .
a a a
Si se tiene un número dado de electrones que pertenecen a esta banda de
energía y si la temperatura está en el cero absoluto, los estados electrónicos de
energía estarán todos ocupados hasta una energía de Fermi dada, de acuerdo con el
principio de exclusión de Pauli. Por tanto, la distribución de electrones quedará
dentro de un volumen en el espacio k que está limitado por una superficie de
energía constante y en donde el valor de la energía sobre la superficie es la energía
de Fermi e1. Con frecuencia, esta superficie se denomina superficie de Fermi. De
acuerdo con la exposición de la sección 5.5, se vio que la superficie de Fermi para
electrones libres es una esfera. Para electrones que están dentro de un potencial
periódico de un cristal, la superficie de Fermi puede ser también aproximadamente
esférica si la banda está casi vacía o casi llena; este hecho se ilustra claramente en la
figura 8.11(a) y (f) para el ejemplo que acaba de verse en detalle. A temperaturas
que sobrepasan al cero absoluto, algunos de los electrones se excitarán a estados de
energía superiores a e1 , quedando fuera de la superficie de Fermi, y se tendrán
algunos estados desocupados dentro de esta superficie. En consecuencia, la transición
entre los estados llenos y vacíos ya no será muy marcada. No obstante, si la
temperatura es pequeña en comparación con la de Fermi, la región de transición será
muy delgada y la validez esencial del cuadro de la superficie de Fermi no se verá
afectada.
A continuación se examinará lo que sucede en les puntos de la superficie del
cubo limitante que encierra al volumen del espacio k, que pueden ocupar los estados
electrónicos pertenecientes a esta banda. Para mayor simplicidad, primero se limitará
la atención solamente al plano kxky; las soluciones de este plano se relacionan con
Dinámica del electrón, superficies de energía y zona de Brillouin 263

(o) (ko«l) (b) (•«1+4/3)

(e) (• =• 1+4/3)

(e) (• =•1+8/3) (f) (•1+8/3« «1+12t:l)

Figura 8.11. Configuraciones sucesiva; de la superficie de Fermi para un cristal cúbico simple
con funciones de onda e'féricamente simétrica' en la aproximación en donde sólo
se toman en cuenta las interacciones del vcl in o má~ cercano. Al aumentar la
población electrónica en la banda, elevando con ello, el nivel de Fermi desde la
base de la banda ha~ta la parte superior de la misma, la superficie de Fermi pasa
de la forma casi esférica que aparece en (a), atravesando las formas intermedias
compleja~ (b)-(e), hasta llegar a la configuración cubo menos esfera en la zona de
Brillouin ca'i llena ilustrada en (f).

una red cristalina cuadrada bidimensional. Sea un punto en el borde superior (o


inferior) de la región cuadrada que se ilustra en la figura 8.12; la coordenada ky de
este punto es rrfa, en tanto que la coordenada kx puede tener cualquier valor
arbitrario, por ejemplo, kxo· Entonces, la longitud de onda A. del electrón estará
dada por

(8.8-11)
264 Teoría cuántica de los electrones en redes periódicas

en tanto que el seno del ángulo incidente e relacionado con un conjunto de planos
cristalinos paralelos al eje x, es

sen e= ky = nfa . (8.8-12)


Jk~ +k; Jk2
.xO
n2
+ a2
De acuerdo con esto, es obvio que la condición de Bragg (2.1-1) con n = 1, se
satisface mediante la función de onda electrónica en todos los puntos en esta parte
de la frontera. Del mismo modo, es fácil verificar que la condición de Bragg (relacio-
nada ahora con un ángulo incidente que se indica como un conjunto equivalente de
planos paralelos al eje y), se satisface en todos los puntos del borde derecho (o
izquierdo) del cuadrado limit.mte. El electrón, considerado como una onda, se difrac-
ta internamente mediante la red, siempre que su vector de cantidad de movimiento
toque esta frontera cuadrada. Los puntos del espacio k que quedan más allá de los
límites de estas fronteras corresponden a los puntos que están fuera de la banda de
energía más baja, perteneciendo a otras bandas que se originan en estados atómicos
de energía más alta que el estado basal. Los límites de las regiones del espacio k
ocupadas por las bandas más altas, se determinan mediante la orientación de las
fronteras a lo largo de las cuales se pueden producir reflexiones de Bragg (n > 1) de
orden más alto. Siempre existe un vacío de energía entre las bandas, como se ilustra
en la figura 8.10; por ejemplo, siempre que se cruza el borde de la región cuadrada
encerrada por las líneas kx = ± rr/a, ky = ± rr/a, debe ocurrir una discontinuidad de
energía acompañada de una reflexión interna de Bragg. El interior de la región
contiene la totalidad de estados pertenecientes a la banda de energía más baja.
Se observará que el vector k tiene las mismas dimensiones que la red recí-
proca. En la sección 2.6 se demostró que la condición de reflexión de Bragg puede
escribirse como
(8.8-13)

en donde k es el vector de propagación y en donde G/2rr es un vector que va desde


el origen hasta cualquier punto de la red recíproca. Para una red cuadrada bidimen-
sional de puntos cuyo espaciamiento reticular es a, la red recíproca es una red
cuadrada con un espaciamiento reticular 1/a. Si para mayor facilidad se considera
que el origen está en un punto de red, los vectores G tienen la forma

2n •
G,.. = -(¡,u" + viy. ) (8.8-14)
a

en donde ¡.¡. y v son enteros y en donde ix e iy son vectores unitarios en las


direcciones kx y k y, respectivamente. Si se usa esta forma para el vector G, (8.8-13)
se convierte en

¡.¡.k" + vk, = --1t (¡.¡. 2 + v2 ). (8.8-15)


a
Esta ecuación representa una familia de líneas rectas en el plano kxky. Sus
intersecciones kx y ky son
.. np.z+v2
k" mtcrseccwnes: - -- - - -
a fJ.
(8.8-16)

ky intersecciones:
a v
Diruímica del electrón, superficies de energía y zona de Brillouin 265

Cada una de estas líneas representa una frontera a lo largo de la cual se


produce una reflexión de Bragg y que puede formar la frontera entre estados perte-
necientes a diferentes bandas de energía. Si se toma 11 = O, v = ± 1, y 11 = ± 1, v = O
en (8.8-15), se obtienen las cuatro líneas kx = ± rr/a y ky = ± rr/a que encierran la
región ilustrada en la figura 8.12, cuyo interior contiene todos los estados de la

Figura 8.12. Contornos de energía constante dentro de la zona de Brillouin, para una red
cuadrada bidimensional, usando sólo funciones de onda esféricamente simétricas y
las interacciones del vecino más cercano. Se forma el mismo patrón mediante los
trazos de la superficies de Fermi de la figura 8.11 para la red tridimensional sobre
el plano kxky.

banda de energía más baja del cristal. Esta reg10n del espacio k se denomina la
primera zona de Brillouin (esta terminología ya se introdujo en relación con los
cálculos unidimensionales que se vieron en la sección 3.3). Si ahora se considera
J1 = ± 1, v = ± 1, se obtienen las cuatro líneas kx ±ky = 2rr/a y kx ± ky = - 2rrfa.
Estas cuatro líneas aparecen grafícadas en la figura 8.13(a). En estas fronteras, la
condición de Bragg (2.1-1) se satisface con el orden de reflexión n, que es igual a 2.
Esto se puede demostrar a través de los mismos métodos que se emplearon antes en
conexión con las fronteras de la primera zona de Brillouin. La región encerrada
entre la primera zona de Brillouin y estas cuatro líneas intersectoras contiene todos
los estados correspondientes a la segunda banda de energía (que se relacionaría con
el segundo nivel atómico de energía más baja si la aproximación del enlace firme
fuera válida). Esta se conoce como la segunda zona de Brillouin, que tiene la misma
área que la primera y, en efecto, las cuatro secciones independientes de esta zona se
pueden trasladar al interior de la primera moviendo las secciones paralelas a los ejes
en distancias que sean enteros múltiples de 2rr/a. Por tanto, las cuatro secciones
encajan como piezas de un rompecabezas para formar una región cuadrada que es
una réplica exacta de la primera zona, como lo ilustran las líneas punteadas de la
figura 8.13{a). La última representación de la segunda zona es, sencillamente, la
266 Teoria cuántica de los electrones en redes periódicas

Ir,

c:_--:_1 Pnmera zona


[~' Segunda zona
r::-l Tercera zona
_j

~] Cuarta zona
(e)
o

• Quinta zona

Figura 8.13. Construcción de las zonas de Brillouin para una red cuadrada bidimensional (a)
Primera y segunda zona~, (b) construcción de la tercera zona, (e) las primeras
cinco zonas.

representación de zona reducida de la secc1on 8.5. La justificación de una transfor-


mación de este tipo con referencia al modelo de Kronig-Penney ya se vio en esa
misma sección.
Expresado con más precisión, si

(8.8-17)

es una función de onda del sistema que satisface las ecuaciones de Schrodinger y
todas las condiciones de frontera pertinentes, y si se define

. ('2-
k , -_k_ lx n_,;rr)
- -
. (2nyn)
ly - - -
. (211zí'C)
lz - - ' (8.8-18)
a a a
Dinámica del electrón, superficies de energía y zona de Brillouin 267

en donde ix, iy e iz son vectores unitarios a lo largo de las direcciones kx, k y, kz y


en donde nx, ny, nz son enteros, la misma función de onda se puede expresar como

= eik' •v(r), (8.8-19)

en donde v(r) es nuevamente una función periódica que tiene la periodicidad de la


red. De donde la función de onda se puede escribir en la forma de Bloch en
términos de k o el vector de onda transformado k'. Se debe observar que (8.8-18)
se puede escribir también como

k'= k- G (8.8-20)

en donde G/2n es un vector que conecta dos puntos reticulares de la red recípro-
ca.11 La transformación (8.8-18) o (8.8-20) puede usarse siempre para llegar a una
representación de zona reducida en la que la zona transformada ocupa la misma
región del espacio k que la primera zona. La situación es muy similar a la que se
encontró en la sección 3.3 en el caso de las vibraciones mecánicas de una cadena
lineal de masas discretas puntuales y que se vio en relación con la figura 3.8.
Las zonas más altas se pueden construir mediante una ampliación del proce-
dimiento usado para llegar a la forma de la primera y segunda zonas. En (8.8-15), si
se toma 11 = O, v = ± 2 ó 11 = ± 2, v = O, se obtienen las cuatro líneas kx = ± 2n/a,
ky = ± 2n/a, como se indica en la figura 8.13(b). También en este caso es evidente
que la reflexión de Bragg se desarrolla a lo largo de estas líneas y la primera
reacción es asignar todos los espacios que quedan fuera de la segunda zona y dentro
del área encerrada por estas cuatro líneas, a la tercera zona de Brillouin. Sin em-
bargo, esto no es correcto, ya que esta área es mucho mayor que la de la primera y
segunda zonas, y cada zona de Brillouin debe encerrar la misma superficie dentro del
espacio k. En realidad, existen líneas de reflexión adicionales de Bragg que pasan
por esta superficie y forman fronteras que dividen este espacio en las zonas tercera,
cuarta, quinta y sexta. El criterio que se sigue para saber de qué zona se trata es el
siguiente: al desplazarse a lo largo de una línea radial general que no atraviesa
ninguna intersección de las líneas de reflexión de Bragg, principiando desde el ori-
gen, se debe pasar por la primera, la segunda, la tercera, la cuarta, • • • etc., zonas
sucesivamente, y cada línea de reflexión de Bragg que se cruce forma la frontera a
lo largo de la trayectoria radial entre una zona y la siguiente zona vecina más alta.
En consecuencia, al seguir adelante desde el origen por la línea OA, se penetra en la
tercera zona en C y se sale de ella en D, con la siguiente línea de reflexión de
Bragg que intersecta a OA, más allá de D, se penetra en la cuarta zona. No obs-
tante, si se desplaza a lo largo de la línea OB, se entra a la tercera zona en E y se
sale de ella en F, que se queda· sobre la línea kx = n/a que es ahora la tercera línea
de reflexión de Bragg desde el origen, a lo largo de la trayectoria OB. Más allá de
F, por la línea OB queda una parte de la cuarta zona. De donde, la tercera zona se
compone de los ocho triángulos que se ilustran en la figura 8.13(b). Nuevamente es
obvio que estos ocho triángulos se pueden ensamblar de tal modo que formen un
cuadrado dentro de la primera zona, si se someten a una traslación apropiada de
acuerdo con (8.8-18). Las fronteras de la cuarta zona se forman, en parte, por las

11 En efecto, la expresión (8.8-20) es en realidad la definición fundamental de esta trans-


formación, mientras que (8.8-18) se refiere específicamente a una transformación de esta natura-
leza en el caso particular de la red cúbica simple.
268 Teoría cuántica de los electrones en redes periódicas

líneas para las que J.1 = ± 1, v = ± 2, y J.1 = ± 2, v = ± 1 (en donde se toman todas las
permutaciones posibles de los signos más y menos). Se obtiene una familia de ocho
líneas (tales como kx ± 2kx =- Srr/a), que conduce a las fronteras de las zonas
cuarta y quinta, como se indica en la figura 8.13(c), por los procedimientos antes
descritos. Evidentemente, este método de cálculo se puede extender ad infinitum
para encontrar tantas zonas como se desee. Al construir las fronteras de las zonas de
Brillouin, de este modo, generalmente conviene principiar con vectores G cuyas
magnitudes (según se obtienen a partir de [8.8-14] o su equivalente en otra estruc-
tura cristalina) son tan pequeñas como sea posible, y luego procediendo al siguiente

(a)

(d)
(e)

Figura 8.14. Configuración de la primera zona de Brillouin para (a) una red cúbica simple, (b)
una red cúbica centrada en el cuerpo, (e) una red cúbica centrada en la cara y
(d) una red hexagonal.

conjunto de vectores G más cortos, Juego a los siguientes más reducidos y así
sucesivamente. Puesto que la condición de reflexión de Bragg implica la formación
de ondas estacionarias a una incidencia normal, la velocidad de grupo y, por ende, el
gradiente de e normal a la frontera de cualquier zona de Brillouin, debe desaparecer,
es decir,

(-aro)
ak .l a la frontera
1
= n · Vkw =- n · Vke =O
li
(8.8-21)

en la zona de frontera, si n es un vector unitario normal a la frontera. Se puede


verificar esta conclusión general a partir de los resultados del modelo de potencial de
Aisladores, semiconductores y metales 269

Kronig-Penney, la aproximación del electrón libre y la aproximación del enlace firme.


Estos detalles quedan como ejercicio para el lector.
La extensión de estos resultados para incluir redes tridimensionales es total-
mente directa. Por supuesto, en este caso las zonas de Brillouin son regiones tridi-
mensionales del espacio k encerradas por planos a lo largo de los cuales se satisface
la condición de Bragg. Las ecuaciones de estas fronteras de plano se obtienen de la
ecuación (8.8-13) al igual que sucedió en el caso bidimensional. Nuevamente cada
zona tiene un volumen equivalente y las partes separadas de las zonas más altas se
pueden juntar para formar una réplica de la primera zona, aplicando la transfor-
mación apropiada de (8.8-20). Es evidente que la primera zona de Brillouin para una
red cúbica simple es un cubo cuyo lado es 2Tr/a. La forma de la primera zona de
Brillouin para las redes cúbicas centrada en la cara y centrada en el cuerpo, así
como para la estructura hexagonal, se ilustran en la figura 8.14. La zona para la red
cúbica centrada en el cuerpo es un dodecaedro rómbico en el que todas las caras
son planos { 11 O} dentro del espacio k. La zona para la red cúbica centrada en la
cara es un tetradecaedro, un poliedro de 14 caras, que tienen una orientación {110}
y { 111}. La superficie de Fermi debe tener, en todos los casos, las propiedades de
simetría de la zona de Brillouin correspondiente que, a su vez, se relacionan con las
propiedades de simetría de la red cristalina.

8.9 AISLADORES, SEMICONDUCTORES Y METALES

En la seccwn 8.5 se demostró que no se puede obtener una corriente eléctrica


en bandas vacías o bandas totalmente llenas. Por tanto, cualquier conductividad
eléctrica que presente un cristal debido al movimiento de electrones libres, se debe
al movimiento de electrones dentro de las bandas de energía que están sólo parcial-
mente llenas. Esta observación constituye la base de la diferencia entre los aisladores,
los conductores metálicos y los semiconductores.
En un aislador, el número de electrones dentro del cristal es apenas el sufi-
ciente para llenar completamente cierto número de bandas de energía. Sobre estas
bandas de energía existe una serie de bandas totalmente llenas; pero entre las bandas
llenas y vacías se encuentra una región de energía prohibida tan ancha que es
prácticamente imposible, a temperaturas físicamente posibles, excitar térmicamente
un número importante de electrones para que atraviesen esta región desde la parte
superior de la banda llena más alta a la base de la banda vacía más baja. Entonces,
todas las bandas están ya sea llenas o vacías y no puede fluir una corriente de
electrones libres. Esta situación se ilustra en la figura 8.15(a).
Si es muy pequeño el vacío de energía .1€ entre las bandas llenas y vacías en este
tipo de cristal, y, por tanto, se tiene una probabilidad estadística apreciable de que
los electrones puedan excitarse térmicamente de estados cercanos a la parte superior
de la banda llena, para atravesar el vacío, hasta los estados cercanos a la base de la
banda vacía. Se dispondrá de un número limitado de electrones libres para conduc-
ción de corrientes eléctricas en la banda superior casi vacía y, además, los estados
electrónicos vacíos que quedan cerca de la parte superior de la banda más baja
permiten que esta banda contribuya al flujo de corriente eléctrica a través del meca-
nismo de conducción por huecos. Un material de esta naturaleza se conoce como
semiconductor; su conductividad eléctrica es casi siempre mucho menor que la de un
metal debido a la concentración limitada de electrones libres y huecos y, además,
depende enormemente de la temperatura, que aumenta con gran rapidez al incremen-
tarse ésta, ya que la probabilidad de la excitación térmica se incrementa con la
270 Teoría cuántica de los electrones en redes periódicas

temperatura. Por supuesto, la conductividad eléctrica de un semiconductor es tam-


bién una función del vacío de energía ..::le- La diferencia entre los aisladores y los
semiconductores es sólo de grado; todos los semiconductores pueden hacerse aisla-
dores ideales conforme la temperatura se acerca al cero absoluto, debido a que
entonces la probabilidad asociada con la excitación térmica se hace tan pequeña que
tiende a desaparecer. Del mismo modo, a temperaturas lo suficientemente elevadas
(que con frecuencia son imposibles de alcanzar en la práctica debido a que el cristal
se funde o se evapora), todos los aisladores presentan propiedades semiconductoras.
La estructura de las bandas de un semiconductor aparece ilustrada en la figu-
ra 8.15(b).
Si el número de electrones de un cristal no base.! para llenar por completo la
banda de energía más elevada, sino que la deja sólo llena en parte, muchos de ellos
pueden comportarse como electrones libres y servir como carga o portadores de
carga. En la figura 8.15(e) se ilustra esta situación. Un cristal de esta índole pre-
sentará todas las propiedades características de un conductor metálico, por ejemplo,
alta conductividad eléctrica y térmica y una gran reflectividad óptica.

Distribución
de Fermi-Dirac Banda "casi vacía"
Banda "vacía" ---~--
Electrones térmicamente Banda superior

6•
excitados
\-~------ ;_;= l Ban:~;~ ~:~~~:l=:_:nte llena l-
superpuesta

~~T ~~ ~j~&~~~
E d 1 •
sta os e ectronico~
~~ :wd~- Banda inferior;;
vacíos ~~y~~9~L );;:;: casi llena /;
W(///~%
w~lena/;/~
W'ff~
2LL/.'///h
?/íllenaW

0gUenaW
o
(o) Aislador (bl Semiconductor (el Metal (d)Metal
(Banda parcial- (Banda
mente llena) superpuesta)

Figura 8.15. Diagrama de las bandas de energía de (a) un aislador, (b) un semiconductor, (e)
un conductor metálico (banda parcialmente llena) y (d) un conductor metálico
(bandas superpuestas).

La determinación del número de estados electrónicos disponibles en una banda


de energía dada de una substancia particular, no es un procedimiento del todo
directo y, en general, implica el uso de técnicas de cálculo de la mecánica cuán tic a
que están fuera del alcance de esta obra. Si se supusiera que siempre es válida la
aproximación del enlace firme, las bandas de energía siempre se originarían de los
niveles de energía de los átomos aislados, las funciones de onda de una banda dada
se compondrían siempre de una combinación lineal de las funciones de onda del
estado electrónico de energía correspondiente de los átomos aislados y el factor de
degeneración, asociado con un nivel de energía dado en la banda de energía, sería el
mismo que el del nivel correspondiente del átomo libre. De acuerdo con esto, se
Aisladores, semiconductores y metales 271

tendría una banda ls ccrrespondiente al nivel ls, una banda 2s, una banda 2p, una
banda 3s, una banda 3p, una banda 3d y así sucesivamente. De acuerdo con la
ecuación (8.2-20), el número de niveles de cada banda sería N y, puesto que la
degeneración de cada nivel es el mismo que el del nivel atómico correspondiente, el
aúmero de estados cuánticos electrónicos (incluyendo la degeneración de espín) de
cada banda sería el que se indica en la tabla 8.1.

TABLA 8.1.

Banda No. de estados

Is 2N
2s 2N
2p 6N
3s 2N
3p 6N
3d ION

Por ejemplo, ahora se verá un metal alcalino como el sodio. El sodio tiene dos
electrones Is, dos electrones 2s, seis electrones 2p y un solo electrón 3s. En un
cristal de N átomos se tienen, entonces, 2N electrones ls, 2N electrones 2s, 6N
electrones 2p y N electrones 3s. Si se comparan estas cifras con las que se dan en la
tabla 8.1, se llega a la conclusión de que las bandas ls, 2s y 2p, están totalmente
llenas; pero que la banda 3s, que contiene 2N estados, sólo está llena a la mitad.
Por tanto, se puede esperar que el sodio -junto con todos los demás metales al-
calinos- sea un conductor metálico, como en efecto lo es. Por otro lado, si se
acepta estríctamente este método, debe esperarse que el magnesio, cuya estructura
atómica es Is 2 )2s 2 2p 6 )3s 2 , sea un aislador o semiconductor, ya que ahora la banda
3s está llena. El hecho de que el magnesio (y otros elementos alcalinotérreos)
sean metales, se debe al hecho de que la energía de las bandas 3s y 3p se super-
pone y algunos de los electrones "se derraman" de la banda 3s a la 3p, dejando
a la primera no del todo llena y haciendo que está última esté parcialmente ocu-
pada, como se ilustra en la figura 8 lS(d). En realidad, las funciones de onda 3s
y 3p de estas bandas se entremezclan intensamente, de modo que ni siquiera es del
todo correcto referirse a las bandas en esta forma. A decir verdad, el método
sencillo del enlace firme ya no es una buena aproximación que permita describir el
comportamiento de los electrones s y p en la capa exterior de valencia de la
mayoría de las substancias metálicas; esta mezcla de las bandas s y p para los
electrones de valencia es más bien la regla que la excepción. Por ejemplo, en el caso
del silicio, los estados 3s y 3p se combinan en dos bandas que no se superponen, en
donde cada una de ellas contiene 4N estados, de tal manera que los electrones de
valencia 4N ocupan por completo la banda inferior para fonnar la configuración de
banda de un semiconductor como la de la figura 8.15(b).
La superposición de bandas se produce a pesar de que existe un vacío de
energía en todos los puntos en la frontera de la zona de Brillouin que separa las dos
bandas. Usando la zona cuadrada de la figura 8.12 como ejemplo, se puede ver
claramente cómo se presenta esta situación. La superficie de Fermi en esta figura
toca primero la frontera de zona a lo largo de los ejes kx y ky a una energía
E= e 1 + 4(3; pero la zona de Brillouin y la banda de energía correspondiente no
~stán completamente llenas hasta que e -- <: 1 + 8(3. Puede suceder que el vacío de
energía entre esta banda y la siguiente, en la dirección de los ejes kx y k y, sea
272 Teoría cuántica de los electrones en redes periódicas

menor que 4(3, que es la energía adicional requerida para llenar por completo la
banda inferior. Si esto sucede, los electrones se derramarán hacia la banda superior
en las direcciones kx y ky antes de que se llenen por completo los vértices de la
zona original, dando como resultado la situación de superposición de bandas que se
mencionó anteriormente. Esta situación se ilustra en la figura 8.16. Debe recalcarse

~(k)

Esquinas no llenas
Electrones que de la banda inferior
llenan parcialmente (conducción por huecos)
la sigUI en te
zona superior

Los electrones
"se derraman"
sobre la
siguiente banda
(conducción
por electrones)
Esquinas de la
zona no llena

(a) .,.
a
- - ~(k) Relación a lo largo de la trayectoria OA
- - - <(k) Relación a lo largo de la trayectoria OB
(b)

Figura 8.16. (a) Un caso en el que los estados de energía más bajos dentro de la banda más
alta (en los centros de los lados de la zona cuadrada, sobre los ejes kx y kY.)
tienen una energía más baja que los estados de energía más alta de la banda más
baja (en las esquinas de la zona). En estas circunstancias, los electrones comienzan
a ocupar la banda más alta antes que la más baja esté completamente llena. (b)
Representación esquemática de la relación de f en función de k en la dirección
OA (las curvas continuas) y OB (curvas punteadas) que ilu~tra de un modo ligera·
mente distinto la situación descrita en (a)

que cuando se presenta esta circunstancia, la supostcton simple del enlace firme de
las funciones atómicas de onda asociadas con un solo nivel ya no es válida y que las
bandas de energía se deben volver a calcular, suponiendo una mezcla de funciones
de onda relacionadas con ambas bandas. También debe hacerse notar que en esta
situación, tanto la conducción electrónica efectuada por los electrones que se derra-
man hacia la banda superior, como la conducción de huecos realizada por los es-
tados vacíos en la parte superior de la banda más baja, se producen de un modo
simultáneo. La superficie de Fermi entonces tiene dos ramas separadas, una para
electrones en la zona externa y otra para huecos en la zona original. Si la masa
efectiva del hueco es menor que la del electrón, esta situación conduce a un coefi-
ciente positivo de Hali.l 2 Así se puede comprender una de las discrepancias más
inquietantes de la teoría original del electrón libre de los metales.

12 En un capítulo posterior se verá la forma en que esto sucede.


Densidad de la función de estados y Cllmbios de fase 273

Se observa que la teoría cuántica permite entender en términos generales, por


qué las propiedades eléctricas de los conductores metálicos y los aisladores son tan
marcadamente distintos, aun a pesar de que con frecuencia se requiere un cálculo de
mecánica ondulatoria muy elaborado para establecer con exactitud las superficies de
énergía y las funciones de onda relacionadas con las bandas electrónicas de valencia
en una substancia en particular.

8.10 DENSIDAD DE LA FUNCION DE ESTADOS


Y CAMBIOS DE FASE EN ALEACIONES BINARIAS

En el capítulo 5 se derivó la función de densidad de estados para partículas


libres en la forma de la ecuación (5.2-22). Intuitivamente, parece obvio que la fun-
ción de densidad de estados para los electrones dentro de los cristales debe ser la
misma que la que se obtuvo antes, excepto quizá que se debe incluir la masa
efectiva en lugar de la masa inercial. En breve se verá que esto es cierto, a condi-
ción de que las superficies de energía constante sean esféricas. Sin embargo, si las
superficies de energía constante se desvían de la forma esférica, la función de den-
sidad de estados se hace mucho más compleja.
Para principiar, es importante indicar que los valores permisibles para la can-
tidad de movimiento del cristal hk, cuando se imponen condiciones periódicas de
frontera, de acuerdo con (8.2-20), son los mismos que los valores permisibles de la
cantidad de movimiento inercial de una partícula libre, como lo establece (5.2-15).
El volumen de espacio de la cantidad de movimiento por estado cuántico, entonces
es el mismo que antes y la tarea de determinar la densidad de estados puede
lograrse, como antes, encontrando el número de estados cuánticos dv entre las super-
ficies de energía constante correspondientes a las energías e y e +de, calculando el
volumen del espacio de la cantidad de movimiento entre las dos superficies y divi-
diendo entre t/h 3 , el volumen por estado cuántico. El elemento de volumen del
espacio de cantidad de movimiento se puede escribir como sigue
h3
dvP = p2 sen(} dp d(} d</J = 8n: 3 k 2 sen 8 dk d(} d</J, (8.10-1)

por lo cual, el número de estados dentro del volumen es

dvP 1 1 dk
lh 3 = -4 3 k 2 sen(} dk d(} d</J = - 3 - • k 2 sen(} de d(} d<jJ. (8.10-2)
z n: 4n: de

El número de estados dv = g( e) de en el rango dt: energía de alrededor de e se


obtiene integrando sobre los ángulos polares O y cf> en el espacio k. De donde,

1 ffk 2 sen(} d8 dcp 1 f dSk (8.10-3)


g(e) = 4n: 3 (defdk) = 4n: 3 Js (defdk)'

en donde dSk representa el elemento de superficie de área k 2 sen OdO dcf> sobre la
superficie de energía constante dentro de la zona de Brillouin. Es evidente que si se
conoce la función e(k), la densidad de estados se puede calcular, en principio, a
partir de (8.10-3). Sin embargo, desafortunadamente la forma matemática de e(k) es
274 Teoría cuántica de los electrones en redes periódicas

tan compleja en casi todos los casos de interés práctico, que la integración se puede
efectuar sólo por métodos númericos. Para la red cúbica simple en la aproximación
del enlace firme, la función e(k) para una banda s está dada por (8.7-16) y la
densidad correspondiente de la función de estados, según lo establece (8.10-3), es
como se ilustra en la figura 8.1 7.

Figura 8.17. Curva de densidad de estados para una red cúbica simple de acuerdo con la
aproximación del enlace firme, como se calculó a partir de (8.10-3) y (8.7-16).

Cerca de la base de la banda de energía de este ejemplo en particular, la


forma de e(k) está rlada por (8.8-9); entonces, se tiene, para esta región.

de 2
y dk = 2{Ja k. (8.10-4)

Puesto que e es independiente de 8 y cp en estas circunstancias, (8.10-3) se


puede integrar sobre estos ángulos para que dé

n
i i"
dk 2 "
g(e) = -4 13 k 2 -d
eoo
sen e dO de/> = k2 2 -d
ne
dk , (8.10-5)

o bien, usando (8.10-4),

(8.10-6)

Si se usa (8.7-18) para expresar {Xl 2 en términos de la masa efectiva, esto se


puede escribir como

g(e) 8~
= _v_"'-~' m*312Je--e (e - e1 ~ 12{1),
h3 1 (8.10-7)

que, a condición de que el origen de la energía se tome en la base de la banda, es


la expresión parabólica acostumbrada de la densidad de estados de' electrón libre, en
donde la masa inercial se ha substituido por la masa efectiva m*. De un modo algo
similar, se puede demostrar que para energías cercanas a la parte superior de la
Densidad de la función de estados y cambios de fase 275

banda, en donde las superficies de energía constante vuelven a tener una forma
esférica, se puede escribir

g(e) =
sJ2n m* 312 J---c-·
-¡:;r &1 + 12/3 - & (e1 + 12p - e ~ 12/3). (8.10-8)

Esta función de densidad de estados se desvanece en la parte superior de la


banda, en donde e= e 1 + 12{3, y aumenta parabólicamente para energías decre-
cientes. En consecuencia, se puede considerar como una función de densidad de
estados de partículas libres para conducción por huecos en una banda casi llena. Las
funciones de densidad de estados de electrón libre (8.1 0- 7) y (8.1 0-8), se obtuvieron
en relación a un ejemplo específico; pero se puede demostrar que se obtienen las
mismas expresiones para cualquier estructura cúbica, ya sea que la aproximación de
enlace firme se aplique o no. En los metales del grupo de transición, una banda más
bien angosta que se origina en los estados atómicos 3d, que alojan a 1ON electrones,
se superpone a la banda electrónica de valencia 4s, dando origen a una curva de
densidad de estados para los electrones de valencia como la que se ilustra esquemá-
ticamente en la figura 8.18. A esta curva peculiar de densidad de estados se deben
muchas de las propiedades características de estos metales.

g(•)
d-Banda

Figura 8.18. Característica de superposición de las bandas s- y d- de los metales de transición.

La forma de la curva de densidad de estados y el concepto de la superficie de


Fermi para los electrones de valencia dentro de la zona de Brillouin, se ha utilizado
para explicar ciertos cambios de fase que se relacionan con las aleaciones binarias de
cobre, plata y oro con metales divalentes y trivalentes. El cobre, la plata y el oro
puros son todos elementos nomovalentes que tienen una estructura cúbica cen-
trada en la cara. Por ejemplo, si se principia con plata pura y se agregan cantidades
crecientes de cadmio, la estructura cúbica centrada en la cara que se denomina de
fase a se conserva hasta una concentración determinada de cadmio (llamada límite
a), que es un punto en el que se produce un cambio de fase y la estructura del
cristal cambia de cúbica centrada en la cara a cúbica centrada en el cuerpo, siendo
esta última denominada fase (3. Si la concentración de cadmio se incrementa más
todavía, la estructura cúbica centrada en el cuerpo de fase (j es estable sobre cierto
rango de concentración después del cual se llega a otro punto de transición (deno-
minado límite (j) y la fase (j se transforma en una fase 'Y cuya estructura es un
arreglo cúbico muy complejo en el que se tienen aproximadamente 52 átomos por
célula unitaria. A concentraciones de cadmio todavía mayores, se llega al límite 'Y y
27 6 Teoría cuántica de los electrones en redes periódicas

se forma una fase hexa~onal 'TI de empaquetamiento compacto. Las aleaciones de


otros metales nobles y las que se logran con otros aditivos multivalentes, siguen el
mismo patrón general de cambios de fase aunque los límites a:-, {j- y r- son diferen-
tes en cada sistema individual.
Hume-Rothery 13 sefialó que los límites a:-, {j- y r- de estos sistemas de aleacio-
nes se producen siempre en ciertas razones bien definidas de electrones de valencia
por átomo. En consecuencia, parece ser que el límite {j se alcanza siempre en el
punto en el que se tiene justamente alrededor de 3/2 de electrones de valencia por
cada átomo del cristal, y el límite 'Y se obtiene a una relación de electrón de
valencia por átomo de 21/13. Jones 14 explicó estas observaciones empíricas de
acuerdo con las bases fundamentales. En primer lugar, se debe observar que para el
metal puro monovalente cúbico centrado en la cara que está en la fase a:, la zona de
Brillouin (reducida) para los electrones de valencia es como se indica en la figu-
ra 8.14(e). Puesto que los electrone~ de valencia de los metales nobles son de tipo s,
se puede esperar que esta zona de Brillouin contenga 2N estados electrónicos. En el
caso del metal puro, la zona está llena sólo a la mitad debido a que el número total
de electrones de valencia es N, en este caso. Para mayor facilidad se supondrá, como
lo supuso Jones, que la superficie de Fermi dentro de la zona es esférica en todo
momento. 15 Basándose en esta simple suposición, se puede calcular la curva de
densidad de estados para la zona de Brillouin de un modo muy sencillo; el resultado
aparece ilustrado de una manera esquemática en la figura 8.19. La función de den-
sidad de estados es, sencillamente, una parábola del electrón libre hasta que la esfera
de Fermi toca la frontera de la zona. Sin embargo, a partir de este punto, las
fronteras de la zona cortan partes de la esfera de Fermi y un incremento dado del
radio (correspondiente a un incremento específico de energía) abarca sólo un nú-
mero relativamente pequefio de estados en las esquinas de la zona de Brillouin. La
curva de densidad de estados decrece con gran rapidez, acercándose a cero cuando el
radio de la esfera de Ferrni es igual al radio de la esfera circunscrita. Se puede

La esfera de Fermi
¡-toca la zona de la frontera

Figura 8.19. Representación de la curva de densidad de estados de la red cúbica simple basada
en la idea de la superficie esférica de Fermi que se expande dentro de la zona de
Brillouin, tal y como la empleó Jones.

13 W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931), página 328.
14 H. Jones, Proc. Roy. Soc. 144, 225 (1934); 147, 396 (1934). Véase también N. Mott y
H. Jones, op. cit. página 170.
15 Esta suposición es más apropiada en este caso que en el del cubo simple, cuyas super-
ficies de Fermi se ilustran en la figura 8.11, debido a que la zona de Brillouin circundante tiene
una forma más esférica. En cualquier caso, la forma exacta de la superficie de Fermi no es
particularmente importante para energías TTIIlyores que la que se requiere para que la superficie
de Fermi roce apenas la frontera de la zona.
Densidad de lo función de estados y cambios de fose 277

observar la misma conducta general en la curva de densidad de estados de la figu-


ra 8.17, que se relaciona con una red cúbica simple.
Cuando los átomos de un metal multivalente forman una aleación con la fase
a: monovalente, aumenta el número de electrones libres por átomo, se eleva el nivel
de Fermi y también aumenta el radio de la esfera de Fermi dentro de la zona de
Brillouin asociada con los electrones de valencia. Más allá del punto en el que la
esfera de Fermi toca la frontera de zona, se produce un gran incremento de energía
electrónica con cada pequeño incremento de concentración de electrones libres y,
por tanto, con cada pequeño aumento en la concentración del aditivo multivalente.
En este punto, se obtendrá una energía electrónica total más baja si el cristal sufre
un cambio de fase a una red cuya zona de Brillouin dé acomodo a una esfera
inscrita de mayor tamaño y, en efecto, esto es lo que sucede. La fase a: cúbica
centrada en la cara cambia a una fase (j cúbica centrada en el cuerpo, cuya zona de
Brillouin [figura 8.14(b)] tiene, en efecto, una esfera inscrita de mayor tamaño,
aunque se trate del mismo volumen. Si se hace una adición posterior del elemento
multivalente de la aleación, el radio de la esfera de Fermi aumenta más todavía y
por último toca la superficie de la zona de Brillouin de fase (j. Nuevamente se
produce un cambio de fase, la zona de Brillouin de la fase 'Y resultante viene a ser
un poliedro complejo de 36 caras que tiene una forma más bien esférica 16 que el
dodecaedro rómbico asociado con la fase (j y cuya esfera inscrita es, por ende,
mayor todavía.
De acuerdo con estos argumentos, se pueden hacer cálculos cuantitativos de los
límites a:-, (j- y -y-. En la fase a:, la esfera de Fermi llega primero a la frontera de
zona en las direcciones {lll} dentro del espacio k. El plano (111) que forma parte
del poliedro de la zona de Brillouin tiene [de acuerdo con (8.8-13)], la ecuación

kx +k,+ k,.= 3nfa. (8.10-9)

En el punto de contacto, en el centro de la cara (111), kx = ky = kz = rra, por


lo cual, el radio de la esfera de Fermi es el punto de contacto, kc, debe ·estar dado
por

(8.10-10)

En estas condiciones, el volumen de la esfera de Fermi es 4rrkU3, ó


4 ./frr(rr/a )3, en tanto que se puede demostrar fácilmente que el volumen total de la
zona es la mitad del volumen de un cubo de lado 4rrfa, ó 32(rr/a) 3 . La razón del
volumen de la esfera inscrita a la zona es, por tanto, la relación de estos dos
números, o sea, rr y3/8. El número promedio de electrones de valencia por átomo es
el número por átomo cuando la zona está llena (es decir, 2) por la fracción del
número de estados dentro de la zona que están ocupados. El número de electrones
de valencia por átomo para el límite a: es, entonces, rr y3/4 ó 1.362. Los valores de
los límites (j- y -y- se pueden obtener usando los mismos procedimientos generales.
En la tabla 8.2 se ilustran los valores obtenidos en comparación con los valores
derivados empíricamente por Humes-Rothery.
Naturalmente, puesto que las superficies de Fermi no pueden ser perfectamente
esféricas, las estimaciones de Jones deben considerarse sólo aproximaciones; sin em-
bargo, se ha encontrado que concuerdan muy bien con los límites de fase determi-
nados de un modo experimental. Los diagramas de fase de sistemas de aleaciones
más complejos se entienden a menudo de acuerdo con las superficies de energía

16 Véase F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Company, Inc., Nueva
York (1940), figura 13, página 433.
278 Teoría cuántica de los electrones en redes periódictJS

TABLA 8.2.
Relación electrón-átomo

Límite de fase Hume-Rothery· Jones


a 1.362
p 1.5 1.480
y 1.615 1.538

electrónica y la función de densidad de estados dentro de la zona de Brillouin; pero


los detalles de los cálculos y las respuestas resultantes son muy complejas.

EJERCICIOS
l. Demuestre que si en el modelo del potencial de la figura 8.2, usado en relación con el
cálculo de Kronig-Penney, se permite que V0 se haga infinitamente grande y b tienda a cero en
tal forma que el producto P =- {j2ab/2 se mantenga fijo, entonces la ecuación (8.3-12) se
convierte en

sen aa
P--
aa
+ cos aa =cuska.

Si se hace una gráfica de la función del lado izquierdo, se observará que se comporta de un
modo similar a (8.3-15) y (8.3-16) como se ilustra en la figura 8.3. La cantidad P se puede
considerar como la "potencia de dispersión de un solo pico de potencial".
2. Demuestre que en el caso que se vio en el ejercico 1 anterior, la cantidad de/dk
desaparece en los bordes de la banda (k = nTr/a ).
3. Demuestre que para la- aproximación unidimensional del electrón libre que se vio en la
sección 8.6, de/dk desaparece en los bordes de la banda.
4. Demuestre que para la aproximación de enlace firme en la red cúbica simple que se vio
en la sección 8. 7, n • V.e desaparece en todos los puntos sobre las fronteras cúbicas de la
primera zona de Brillouin.
5. Demuestre explícitamente que los poliedros que aparecen en la figura 8.14(b) y (e) son
las formas correctas correspondientes a la primera zona de Brillouin para las redes cúbica cen-
trada en el cuerpo y cúbica centrada en la cara, respectivamente.
6. Encuentre la relación e(k) para una banda s (funciones de onda esféricamente simétri-
cas) en la aproximación de enlace firme para un cristal cúbico centrado en el cuerpo. Tom,!l·ep
cuenta sólo las integrares de superposición del vecino más cercano. Grafique las formas de las
superficies de energía constante para varias energías dentro de la zona. Demuestre que estas
superficies son esféricas, como sucede en el caso de los electrones libres, para energías cercanas a
la base de la banda. Demuestre también que n • v'.e se desaparece;: en las fronteras de la zona.
7. Obtenga todos los resultados que se requieren en el eJercicio 6 anterior, para una banda
s en un cristal cúbico centrado en la cara de acuerdo con la aproximación del enlace firme,
teniendo .m cuenta sólo la superposición de las funciones de onda del vecino más cercano.
8. Haga un diagrama rsimilar al de la figura 8.13(c)] dentro del plano k, de las primeras
=
cinco zonas de Brillouin de una red bidimensional definida por los vectores de base a aix, b =
3aiy Nota: no se pueden usar las fórmulas (2.5-5) para definrr una red recíproca bidimensional,
debido a que el producto transversal no se puede definir en un espacio bidimensional. Proceda a
partir de las defmiciones fundamentales (2.5-1) y (2.5-2).
9. Demuestre explícitamente, a partir de los resultados de la sección 8.7, que la densidad
de estados cerca de la parte superior de la banda de energía, para el cristal cúbico simple, que
se vio en detalle en esa sección, está dada por la ecuación (8.10-8).
LO. Demuestre que la relación limitante de electrón de valencia por átomo para la tase (3
(cúbica centrada en el cuerpo) de una aleación binaria del tipo que se vio en la sección 8.10, es
1.489. Puede tomar en cuenta la suposición del cálculo de Iones.
11. Demuestre que la función de onda (8.7-3) que se usó en el cálculo de la aproximación
de enlace firme, se puede expresar como una función de Bloch de la forma (8.2-14).
Lecturas recomendadas 279

LECTURAS RECOMENDADAS
W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931).
H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland Pu-
blishing Co., Amsterdarn (1960).
N. F. Mott y H. Jones, Theory of Metals and Alloys, Dover Publications, Inc., Nueva York
(1958).
S. Raimes, The Wave Mechanics of Electrons in Metals, Interscience Publishers, Nueva York
(1961).
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., lnc., Nueva York (1940).
R. A. Smith, Wave Mechanics of Crystalline Solids, John Wiley & Sons, Inc., Nueva York (1961).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
A. H. Wilson, Theory of Metals, 2.a Edición, Cambridge University Press, Nueva York (1953).
CAPITULO 9
Semieonductores electrónicos
unifortnes en equilibrio

9 .l SEMICONDUCTORES

En los capítulos anteriores la preocupacwn principal consistía en entender las


propiedades eléctricas y térmicas de los conductores y los aisladores metálicos, así
.:omo comprender por qué unas substancias son muy buenos conductores eléctricos y
otras, muy deficientes. Estos objetivos se han logrado en general y, a partir de ahora
la atención se centrará en un análisis detallado de las propiedades de los semiconduc-
tores. Hay tres razones por las que esto es algo muy conveniente. En primer lugar
casi siempre se puede usar la estadística de Maxwell-Boltzmann para estudiar la
mecánica estadística de los portadores de carga en semiconductores. Esto significa
que se pueden obtener soluciones analíticas exactas para muchos problemas de semi-
.:onductores que se pueden resolver sólo mediante métodos numéricos o aproximados
en el caso de los metales, en donde se debe utilizar la estadística de Fermi-Dirac.
Comprender los efectos de esta índole en los semiconductores puede proporcionar
.:onocimientos físicos valiosos respecto a sus equivalentes en substancias metálicas.
En resumen, los procesos electrónicos se pueden comprender con mayor facilidad y
profundidad en los semiconductores que en otras clases de cristales. En segundo
lugar, la tecnología del crecimiento de cristales ha hecho posible producir cristales de
ciertas substancias semiconductoras (principalmente germanio y silicio) de una pureza
y perfección cristalina fantásticas, en un grado mucho mayor de lo que se puede
vbtener en la actualidad con metales y aisladores. La existencia de estos cristales casi
perfectos permite al experimentador observar las propiedades de transporte electró-
nico, los efectos termoeléctricos y galvanométricos con facilidad y precisión, teniendo
la certeza de que lo que está tratando de observar no lo oscurecerán los efectos
provocados por impurezas o imperfecciones estructurales en la red cristalina. Por
tanto en los semiconductores se pueden observar e interpretar con facilidad los
fenómenos que, en las substancias metálicas, serían difícil o imposible medir con
precisión o explicar de un modo cuantitativo. Por último, los semiconductores han
adquirido una enorme importancia tecnológica durante las dos últimas décadas. Se
han llegado a utilizar para fabricar todo tipo de dispositivos electrónicos incluyendo
rectificadores, transistores, fotoceldas, reguladores de voltaje, amplificadores paramé-
tricos y dispositivos de conmutación. La apreciación de las propiedades funda-
mentales del transporte electrónico en estas substancias tiene una aplicación directa
en la comprensión y el análisis del funcionamiento de todas las estructuras de dispo-
sitivos que actualmente tienen importancia técnica.

281
282 Semiconductores electrónicos uniformes en equilibrio

El semiconductor es una substancia cristalina que tiene una estructura de ban-


das de energía en la que una banda de estados electrónicos, completamente llena a
la temperatura cero, se separa de otra que está totalmente vacía al cero absoluto.
por medio de una región angosta de energías prohibidas. Esta estructura de banda se
ilustra esquemáticamente en la figura 9.l(a). En el cero absoluto, el semiconductor
es un aislador perfecto, ya que no cuenta con bandas parcialmente llenas. Sin em-
bargo, a temperaturas más altas, algunos electrones de la banda de valencia pueden
adquirir la suficiente energía térmica aleatoria para excitarse a través de la banda
prohibida con el fin de convertirse en electrones de conducción en la banda de
conducción que hasta entonces estaba vacía. Los estados vacíos que quedan en la
banda inferior o de valencia pueden contribuir también a la conductividad compor-
tándose como huecos positivamente cargados. Fs evidente que el número de electro-

Electrones de conducción
/ _ térmicamente excitados
Banda "de conducción"
vacía -
~e~~~-----------
Región prohibida
t:u (Banda de energía prohibida)

Estados vacíos de la banda


de valencia (huecos)
(o) 0°K ( b) Temperatura ambiente (300° K)

Figura 9.1. Bandas de conducción y valencia de un semiconductor (a) al cero absoluto, (b) a la
temperatura ambiente, mostrando electrones y huecos térmicamente excitados.

nes de conducción y el número de huecos debe elevarse al incrementarse la tempe-


ratura y, por tanto, la conductividad eléctrica también aumenta al subir la tempera-
tura.
El mecanismo físico de la conducción por electrones y huecos en semiconduc-
tores covalentes, tales como el carbono (diamante), germanio y silicio, que forman
cristales con la estructura del diamante de la figura 1.9, se puede entender con
mayor claridad en la figura 9.2. En esta figura se muestra la estructura calculada de
bandas de energía del diamante graficada en función del espaciamiento interatómico,
como se hizo en la figura 8.1 O. Los diagramas correspondientes al silicio y al ger-
manio son muy similares. Cuando N átomos aislados se combinan en un cristal, los
niveles atómicos 2s y 2p se amplían a bandas de energía; conforme el espaciamiento
interatómico disminuye, estas bandas se hacen cada vez más anchas y terminan por
superponerse. Cuando la distancia interatómica se hace más pequeña todavía, el
continuo de lo que originalmente eran los estados 2s y 2p se divide una vez más en
dos bandas, cada una de las cuales cuenta ahora precisamente con 4 N estados. A la
distancia interatómica de equilibrio a, estas bandas están separadas por un "vacío de
energía" o región prohibida cuya anchura es ll.e. Puesto que la estructura electró-
nica del carbono es ls 2 )2s 2 2p 2 , se tienen 4 N electrones de valencia disponibl.- que
bastan exactamente para llenar la más baja de las dos bandas y formar la banda de
valencia del cristal. La banda superior se convierte en la de conducción. La región
de energía prohibida en condiciones normales tiene una anchura aproximada de 7 e V
en el diamante, 1.2 eV en el silicio y 0.7 eV en el germanio. Debido a la expansión
Semiconductores 283

tu=7eV (Diamante)
1 z'ev '(Silicio!
(Germanio)

~~~--~6~N~es~t-ad~o-s-+ 2 P
>Niveles átómicos
ffiin:s:o-2~N~e-,st-ad-¡-o-s---¡. 2•

\~nD~=-------------~2~N~e~s~ta~d~o~s---t'•
-----+--:---::-:----:---::-::-:---------;;;;t- _ Espaciamiento
a(= Valor de equilibrio 00 interatómico
del diamante)

Figura 9.2. Las bandas que se originan de los estados atómicos ls, 2s y 2p del carbono
(diamante) como función de la distancia interatómica. [De acuerdo con W. Shock-
ley, Electrons and Holes in Semiconductors, D. van Nostrand Co., lnc., Nueva York
(1950).]

ténnica de la red, este "vacío de energía" tiene una dependencia débil en función
de la temperatura; de acuerdo con la figura 9.2, es evidente que el vacío en la
energía disminuye confonne se expande el cristal. También es obvio, de acuerdo con
este diagrama, que A. e. será una función de la presión, haciéndose mayor confonne
se reduce el espaciamiento interató!llico mediante la aplicación Je presión por me-
dios hidrostáticos o de otra naturaleza. Más a la izquierda del punto A de la
figura 8.10, en donde se superponen las bandas ls y 2s, se pierde el carácter s y p
de los estados electrónicos; por tanto, en la banda de valencia del semiconductor, las
funciones de onda del electrón son una mezcla de funciones de onda atómicas s y p.
Los electrones de la banda de valencia son los que fonnan los enlaces cova-
lentes de parejas de electrones tetraédricamente dispuestos entre los átomos, en la
figura 1.9. La excitación ténnica de un electrón de la banda de valencia a la de
conducción corresponde físicamente a la supresión de un electrón de la pareja del
enlace covalente por medio de la agitación ténnica de la red. Por tanto, el electrón
se convierte en un electrón libre fuera del enlace covalente de la red y queda
disponible para funcionar como portador de carga a fin de conducir una corriente a
través del cristal. Este proceso se describe esquemáticamente en la figura 9.3(a),
aunque se debe recordar que el patrón de enlaces usado es una versión bidimensional
de lo que en realidad es una red tridimensional de enlaces tetraédricos. la excitación
de un electrón deja un defecto localizado en la estructura del enlace covalente del
cristal, que se puede identificar como un estado de banda de valencia que podría ser
ocupado por un electrón; pero que en realidad está vacío. Este defecto constituye el
"hueco" de la sección 8.5. Tanto el electrón libre como el hueco son migratorios; el
electrón libre puede ''vagar" dentro del cristal en una fonna aleatoria, impelido por
la energía ténnica que pueda adquirir de la propia red. Del mismo modo, el hueco
puede desplazarse porque un electrón de un enlace covalente adya~ente al hueco
puede moverse con suma facilidad hacia el hueco, completando así la pareja de
enlace en el sitio original del hueco; pero transfiriendo la ubicación del hueco al
284 Semiconductores electrónicos uniformes en equilibrio

sitio de donde provino el electrón. Esta migración del hueco también puede produ-
cirse por una agitación térmica de la red. Los electrones libres y los huecos se
moverán también en respuesta a un campo eléctrico y pueden dar origen a una
corriente macroscópica que fluye por el cristal. En la figura 9.3(b) se ilustra esta
situación. En este caso, todos los electrones del-cristal, tanto en la banda de conduc-
ción como en la de valencia están sometidos a la fuerza - eE que actúa a la derecha
del diagrama. Los electrones libres se mueven hacia la derecha produciendo un flujo
de corriente convencional a la izquierda, debido a su carga negativa. Además un
electrón de un enlace covalente adyacente a un hueco se puede desplazar a la
derecha hacia el sitio vacío del electrón asociado con él, y el hueco se desplaza
hacia la izquierda al sitio de donde provino este electrón; este proceso se puede
repetir y el resultado neto es una transferencia neta de un electrón hacia la derecha
que va acompañada del movimiento del hueco hacia la izquierda, es decir, en la

11 11 11 11 11 11 11 11 11 "
=@=@=@=@=@= =@=@=@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= =@=@=@=@=@=
11 ll ()¡¡---iT-e 11
11 11 e11 11 11
=@=@-@=@=@= =@j~'~@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= =@=@=@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= @=@=@=@=@=
11 11 11 11 _.11 11 11 11 11 11
Electrones de _.....-. -E
enlace covalente
(o) (b)

Figura 9.3. (a) Un electrón libre y un hueco producidos por la ionización térmica de un
electrón que originalmente se encontraba en un enlace covalente. (b) Movimiento
del electrón libre (a la derecha) y el hueco (a la izquierda) cuando se aplica un
campo eléctrico tal y como se indica.

dirección en que la partícula de carga positiva se movería bajo la influencia de un


campo aplicado. La corriente neta de electrones hacia la derecha da origen nueva-
mente a un flujo convencional de corriente hacia la izquierda que puede represen-
tarse como una corriente de huecos positivos en tal dirección. Así pues, el flujo de
la corriente puede deberse tanto al movimiento de electrones libres como a la migra-
ción de electrones de valencia dentro y fuera de estados vacíos de la banda de
valencia, que se puede considerar mejor como la migración de huecos positivos.

9.2 SEMICONDUCTORES INTRINSECOS


Y SEMICONDUCTORES CON IMPUREZAS

Un semiconductor en el que los huecos y los electrones se crean exclusiva-


mente mediante una excitación térmica a través de la banda prohibida de energía, se
conoce como semiconductor intrínseco. Los huecos y los electrones creados de esta
Semiconductores intrínsecos y semiconductores con impurezas 28S

manera a menudo se denominan portadores intrínsecos de carga y la conductividad


originada por estos portadores se llama conductividad intrínseca. En un semiconductor
intrínseco, las concentraciones de electrones y huecos siempre deben ser las mismas, ya
que la excitación térmica de un electrón origina inevitablemente sólo un hueco.
La población de huecos y electrones en un semiconductor intrínseco se des-
cribe estadísticamente de acuerdo con la función de distribución Fermi-Dirac y las
funciones de densidad de estados para las bandas de valencia y conducción. Puesto
que la parte baja de la banda de conducción y la parte superior de la de valencia
muestran una dependencia esencialmente parabólica de su relación e y k, el compor-
tamiento de los electrones y los huecos en estas regiones es fundamentalmente el de
una partícula libre, con los factores apropiados de masa efectiva. Los electrones y
los huecos se ven raramente excitados hacia las regiones de las bandas de conducción
y valencia en donde sus propiedades pueden diferir del comportamiento de una
partícula libre a temperaturas físicamente posibles de manera que los efectos de
estas excitaciones se pueden desechar para fines prácticos. Entonces, las funciones de
densidad de estados que se van a usar son en esencia las de las partículas libres y
la densidad de estados de la banda de conducción está dada por

ge(e) de= sJh32n m*


n
312 Je -ee de (9.2-1)

y la densidad de estados de la banda de valencia es

g v( e) de= h3 m*P V ~de


Sj2n (9.2-2)
312
t>v- t '

en donde m~ es la masa efectiva de los electrones de la banda de conducción y m;


es la masa efectiva de los huecos de la banda de valencia. 1 Por supuesto, la densidad
de estados en la región prohibida ev <e < ec es cero. En la figura 9.4 aparece una
gráfica de la curva de densidad de estados correspondiente a un semiconductor
intrínseco. Si m; y m~ son precisamente iguales, la energía de Fermi debe quedar

Figura 9.4. Función de densidad de estados de un semiconductor intrínseco.

1 Los subíndices n y p se refieren a los portadores de carga negativos y positivos. Esta


regla se aplicará de un modo invariable.
286 Semiconductores electrónicos uniformes en equilibrio

exactamente en el centro de la región prohibida. Esto es lo correcto debido a que.


de otra manera, la población de electrones en la banda de conducción y los hue-
cos de la banda de valencia, obtenidos integrando el producto de la función de densidad
de estados y el factor de probabilidad f 0 (e) para los electrones en la banda de
conducción, ó 1 - f 0 (e) para los huecos en la banda de valencia, no sería idéntica.
La situación se representa diagramáticamente en la figura 9.5(a). Si y m~ no son m;
iguales (y este es el caso general), la energía de Fermi debe sufrir un pequeño ajuste
ascendente o descendente, alejándose del centro exacto de la banda prohibida de
energía, para igualar las integrales de población y, por tanto, debe quedar cerca,
pero no en el centro de la región prohibida. En la figura 9.5(b) se muestra esta
circunstancia. En una sección posterior se investigará más detalladamente la estadís-
tica de huecos y electrones.

·t 1
-fo(•l
g(•l
1
1
1---uc<•l
Probabilidad f0
1
de ocupación 1
1
de electrones _Producto
f0 (. l9c(• l

., .,
.... Producto
[1-f0 (•l]uv<•l ....
''
Probabilidad
1- t0 para huecos
''
'/' ,
9v<•l
1
f 0 =0 1
2
(o) m~ =m~ (b) m*p =m*,

Figura 9.5. Función de distribución, nivel de Fermi, función de densidad de estados y pobla-
ciones de electrones y huecos de un semiconductor intrínseco (a) en donde
mp =m~ y (b) en donde mp >m~. Ui "ampliación" de la distribución de Fermi se
ha exagerado aquí para ilustrar con mayor claridad; en realidad, a 300°K, la distri-
bución de Fermi sería más bien como la función "escalón" que se encuentra para
T=O.

Es muy fácil introducir cantidades muy pequeñas de substancias tales como


arsénico, antimonio u otros elementos pertenecientes al grupo V de la tabla perió-
dica, en cristales puros de silicio o germanio, como impurezas de substitución, es
decir, como átomos de impurezas que ocupan sitios de la red que normalmente
estarían ocupados por átomos del semiconductor covalente. Los átomos del grupo V
tienen cinco electrones de valencia. Cuatro de ellos se usan para formar enlaces
covalentes con átomos circunvecinos del semiconductor y el quinto se enlaza al
átomo de impureza sólo mediante fuerzas electrostáticas que son muy débiles y, por
ende, se pueden ionizar con facilidad mediante la agitación térmica de la red a
Semiconductores intrínsecos y semiconductores con impurezas 287

temperaturas ordinarias para proporcionar una conducción electrónica adicional. En-


tonces, el átomo de impureza que queda se convierte en un ion positivo, que, sin
embargo, es inmóvil, en vista de que está fuertemente unido a cuatro átomos vecinos
por medio de los enlaces covalentes normales. Esta situación se ilustra en la figu-
ra 9.6(a). En cristales que contienen este tipo de impureza existen más electrones
que huecos (aunque algunos huecos siguen estando presentes debido a los pares
hueco-electrón que se siguen creando térmicamente de vez en cuando). Estos cristales
se denominan semiconductores tipo n, designados así porque la mayoría de los
portadores de carga son electrones negativos. La componente de la conductividad
eléctrica que se produce por los átomos impureza se llama conductividad de impu-
reza. Una substancia cuya mayoría de portadores se origina debido a átomos de
impureza, se conoce como semiconductor con impurezas. Los átomos del grupo V
de substitución se llaman con frecuencia átomos donadores, ya que cada uno de
ellos dona un electrón libre adicional al cristal. Se requiere tan poca energía (como
se verá en breve) para ionizar un átomo de impureza donadora típico del grupo V
en Si y Ge, que prácticamente todas las impurezas del grupo V en estos materiales
se ionizan a temperaturas superiores a aproximadamente 20°K.

11 11 11 11 11 11 11 11
~lectrón =~
hbre
=@ =@ =@ =
O..,l.l
=@=@=@=®=
11 11 11 Hueco---¡¡"' 1 11 11
=@=@~@=@= =@~@=@=@=
11 11 ' ~. 11 11 ' ,t 11 11
=@=®=(e/=@= =®=@~CGt=@=
1111 11 11 11 11 '~u 11
=@=@=@=@= =®=®=@=@=
11 11 11 11 11 11 11 11

(a) (tipo·n) (b) (tipo-p)

Figura 9.6. (a) Electrón libre originado por la ionización de un átomo de impureza de arsénico
de substitución, (b) hueco libre producido por la ionización de un átomo de indio
de impureza de substitución.

Si en lugar de los átomos del grupo V se introducen en la red átomos de


impurezas del grupo lli (Al, Ga, In, etc.), se observará un efecto muy distinto. Estos
átomos tienen sólo tres electrones de valencia que se usan para formar enlaces
covalentes con tres átomos cercanos; pero el cuarto enlace siempre carece de un
electrón. En efecto, existe un hueco adicional que se crea en la estructura del enlace
covalente en el átomo de la impureza. Este hueco puede emigrar fácilmente aleján-
dose del sitio de la impureza debido a que un electrón adicional del enlace covalente
cercano puede emigrar al sitio de la impureza y llenar el cuarto enlace de par de
electrones (que, por supuesto, representa una carga negativa en el átomo de impu-
reza); a continuación, el hueco se asocia con el átomo cercano que no se puede
distinguir de un hueco térmicamente formado. En la figura 9.6(b) se ilustra esta
situación. La energía necesaria para la migración del hueco lejos del sitio de la
impureza es del orden de la energía que se requiere para eliminar el electrón adicio-
nal de un átomo donador. En consecuencia, excepto a temperaturas muy bajas,
todos los huecos serán migratorios y todos lo átomos de impurezas del grupo IIl
tendrán la naturaleza de iones negativos inmóviles. En cristales que contienen predo-
minantemente este tipo de impureza se tienen más huecos que electrones, aunque
288 Semiconductores electrónicos uniformes en equilibrio

.t ·t
lectrones
Electrones

.,_-+-_
Nivel de F Nivel de Fermi
-"---- intrínseco-
.,

Huecos

fo= o fo= O

(a) tipo-n ( b) tipo-p


Figun 9.7. Función de distribución nivel de Fermi y poblaciones de electrones y huecos para
(a) un semiconductor con impurezas tipo n y (b) un semiconductor con impurezas
tipo p. Una vez más, como en la figura 9.5, la "ampliación" de la distribución de
Fermi se exagera con fines ilustrativos.

siempre habrá algunos electrones que se originan debido a la excitación térmica. Los
cristales de esta índole se conocen con el nombre de semiconductores tipo p, dado
que los portadores de carga mayoritarios son positivos. Los átomos de substitución
del grupo III se clasifican casi siempre como átomos receptores, debido a que pue-
den recibir un electrón de la -estructura del enlace covalente liberando un hueco
móvil. Cuando en un cristal semiconductor existen impurezas de ambos tipos, la
conductividad es invariablemente mayor que la referente a un semiconductor puro o
intrínseco a la misma temperatura, debido a los portadores .1e carga lldicionales
originados por los átomos de impurezas y, en general, mientras más grande es 1~
concentración de impurezas, tanto mayor es la conductividad.
La representación estadística de los semiconductores tipo n y p se caracterizan
por la presencia del nivel de Fermi superior (para el tipo n) o inferior (para el tipo
p) a la posición asociada con el cristal puro o intrínseco. Por ejemplo, en un cristal
tipo n, no puede haber más electrones que huecos, a menos que el nivel de Fermi
se ajuste de un modo ascendente en relación con la posición intrínseca, y viceversa
para el tipo p, como se ilustra en la figura 9.7. Conforme varían la temperatura y la
concentración de impurezas, la posición del nivel de .Fermi cambia de un modo muy
complejo. Este tema se ampliará más adelante.

9.3 ESTADISTICA DE HUECOS Y ELECTRONES;


EL CASO DEL SEMICONDUCTOR INTRINSECO

En condiciones de equilibrio térmico, el número de electrones dn 0 por unidad


de volumen que tienen una energía dentro del rango de alrededor de e en la banda
Estadística de huecos y electrones; el caso del semiconductor intrínseco 289

de conducción de cualquier semiconductor, intrínseco o con impurezas, de acuerdo


con los resultados del capítulo 5, es

d n0 -- f ( ) ( )
10 e 9c e
d S-- sJ2.n mn*3/2 J~!.....!!de
----¡;:r- (9.3-1)
1 +e kT

en donde f 0 (e) representa la función de distribución de Femli en equilibrio (5.5-20)


y gc(e) es el factor de densidad de estados (9.2-1). Ahora, ~€, la anchura de la
región de energía prohibida, es casi siempre del orden de 1 eV y kT a la tempera-
tura ambiente (300°K) es aproximadamente 1/40 eV. Si la energía de Fermi está
dentro de la región prohibida, a varias unidades kT lejos del borde de la banda de
conducción (es decir, si €e- e¡'> kl), entonces para todas las energías pertenecientes
a la banda de conducción, el factor exponencial del denominador de la función de dis-
tribución de Fermi es mucho mayor que la unidad. Por tanto, la función de distribución
de Fermi se puede representar en relación con la banda de conducción como
fo(s) ~ e-(e-e¡)/kT (9.3-2)

que es una función de distribución con una forma esencialmente maxwelliana. La


situación en este caso es prácticamente la que se vio en el capítulo 5 en conexión
.:on la ecuación (5.5-27). Puesto que ya se indicó en la figura 9.5 que la energía de
Fermi para un semiconductor intrínseco debe quedar dentro de la región prohibida
de energía, y dado que kT ~ ~€ a todas las temperaturas accesibles, como se señaló
mtes, la condición €e- e¡'> kT se satisface siempre en la práctica y siempre se
puede utilizar la expresión (9.3-2) para semiconductores intrínsecos mejor que la que
es más complicada, (5.5-20). En realidad, en la mayoría de los casos relacionados
.:on semiconductores con impurezas, se descubrirá que esta condición se satisface, lo
.:ual también permite utilizar (9.3-2) para estos semiconductores. Por ejemplo, es
evidente que esta simplificación sería válida para los semiconductores con impurezas
de la figura 9. 7. En las figuras 9.5 y 9. 7 se puede ver que la "cola" exponencial de
la función de distribución de Fermi es la única parte de dicha función que tiene una
superposición con las bandas de c0nducción y valencia. La parte de la función de
Fermi en las cercanías de la energía de Fermi, que es invariablemente la parte que
origina dificultades matemáticas, coincide en todos los casos con una región en
dor.de la densidad de los estados electrónicos disponibles es cero. La aproximación
de simplificación (9.3-2) se conoce con el nombre de aproximación de Boltzmann.
Si se utiliza esta aproximación en (9.3-1) y se integra para obtener el número
total de electrones por unidad de volumen en la banda de conducción, se encuentra
.:¡ue

-
nO = I~
00
dn O
J
8 2n.
= --
h3 m*3f2
n
e•¡lkT I00

~
--
Je-e e e-•tkT de · (9.3-3)

En realidad, los límites de integración deben ser desde Ee hasta la parte supe-
nor de la banda de conducción, sea donde fuere; sin embargo, puesto que !o(€)
desciende muy rápidamente al incrementarse e (-por lo menos para valores razonables
de temperatura), la mayoría de los electrones se concentran en los estados cercanos
J. la base de la banda de conducción. En tanto que la parte superior de la banda
tenga una energía muchas unidades kT mayor que Ee, no hay mucha diferencia en el
290 Semiconductores electrónicos uniformes en equilibrio

hecho de si se integra a la parte superior de la banda o a infmito. Cuando se hace


la substitución

¡;-Be
X=-- (9.3-4)
e kT

la integral (9.3-3) se puede expresar en la forma

(9.3-5)

De acuerdo con (5.4-4), el valor de la integral antenor es r(3/2) = y1r/2. Si se


substituye e.ste valor para la integral, el resultado sería

(9.3-6)
en donde
(9.3-7)

El valor numérico de la cantidad Uc se puede escribir (usando las unidades


cgs) como

(9.3-8)

en donde m 0 es la masa inercial del electrón. Para m:; = rn 0 y T = 300°K, esto da


Uc = 2.51 X 10 19 cm- 3 .
El número de huecos Po por unidad de volumen en la banda de valencia de
un semiconductor, se puede encontrar de un modo similar. En este caso se puede
expresar como dp 0 , el número de huecos en la banda de valencia dentro del rango
de energía de alrededor de e,

(9.3-9)

La cantidad [po(e) es la probabilidad de que un hueco esté asociado con un


estado cuántico de energía e, en otras palabras, que dicho estado estará desocupado.
Esta probabilidad es justamente, uno menos la probabilidad de ocupación f 0 (e).
Puesto que [ 0 (e) está dada por (5.5-20), se puede ver fácilmente que

1
/po(e) = 1-/o(e) = 1 - 1 + e<• .,J!kT - 1 + e<•' •JikT. (9.3-10)

Nuevamente, si la energia de Fermi tiene varias unidades kT por encima del


borde de la banda de valencia, es decir, si e¡- Ev ~ kT, el factor exponencial del
denominador de la expresión (9.3-10) ¡;s mucho mayor que la unidad, para todos los
valores de e en la banda de valencia, se puede hacer que

(9.3-11)

Esta es la aproximación de Boltzmann para los huecos en la banda de valencia.


Si se usa (9.3-11) y la función de densidad de estados (9.2-2) en (9.3-9) y se i,r.tegra
Estadística de huecos y electrones; el caso del semiconductor intrínseco 291

sobre la banda de valencia, se obtiene

(9.3-12)

También en este caso el límite inferior de la integral es - oo y no la base de


la banda de valencia; esta simplificación se justifica más o menos con el mismo
argumento que se usó en relación (9.3-3) para la banda de conducción. Cuando se
hace la substitución

8v- e
X=-- (9.3-13)
v kT

la integral se puede expresar en la forma

(9.3-14)

que se puede evaluar como una función r-, como antes, para dar

(9.3-15)

con

(9.3-16)

El valor numérico de Uv puede obtenerse a partir de (9.3-8), substituyendo en


la fórmula mp por m~.'
Se puede demostrar con facilidad que el producto m 0 p 0 es una función exclusiva
de la banda prohibida de energía t:.e, las masas efectivas y la temperatura, e indepen-
diente del nivel de Fermi o del contenido de impurezas. Por tanto, al multiplicar las
expresiones (9.3-6) y (9.3-15) para n 0 y p 0 , ~e puede obtener

(9.3-17)

Si se usa (9.3-7) y (9.3-16), esto se puede escribir en la forma

(9.3-18)

Para una substancia semiconductora dada, las masas efectivas y la banda prohi-
bida de energía ~e son fijas; de donde, el producto n 0 p 0 de un material dado debe
ser una función exclusiva de la temperatura. Esta es esencialmente una ley de acción
de las masas que rige las concentraciones relativas de huecos y electrones en un
material en particular. Si el semiconductor se encuentra en un estado intrínseco o
puro, las concentraciones de huecos y electrones deben ser iguales, como se vio
antes, debido a que sólo los huecos y los electrones que pueden estar presentes son
los que se generan en pares mediante la excitación térmica de los electrones de la
banda de valencia. En consecuencia, en este tipo de materiales,

Po = n0 = n¡(T) (9.3.19)
292 Semiconductores electrónicos uniformes en equilibrio

en donde n¡(T) representa el número de huecos o electrones por unidad de volumen


dentro de una muestra intrínseca del semiconductor en cuestión a la temperatura T.
En una muestra de la misma substancia que no es intrínseca, sino más bien un
semiconductor con impurezas, el número de huecos y electrones ya no es el mismo:
sin embargo, de acuerdo con (9.3-17), el producto n 0 p 0 debe ser el mismo para este
material que para la substancia intrínseca. Por tanto, se puede escribir, de acuerdo
con (9.3-19),

(9.3-20)

siendo

(9.3-21)

como lo establece (9.3-18). De acuerdo con estos resultados, la concentración de


portadores en un semiconductor intrínseco tiene una gran dependencia de la tempe-
ratura, aumentando rápidamente conforme se incrementa esta última y, de igual
manera, depende enormemente de la banda prohibida de energía Lle, decreciendo
con gran rapidez al aumentar Lle.
La relación de la acción de las masas (9.3-17) ó (9.3-20) recuerda claramente
las leyes que gobiernan las concentraciones relativas de iones en substancias que
están débilmente ionizadas, por ejemplo, los iones H+ y OH- en sistemas acuosos.
En realidad los semiconductores se pueden comprender como un ejemplo de la
teoría clásica de Arrenhius sobre los electrolitos débilmente ionizados en relación
con un sistema en el que un enlace covalente se disocia en un electrón y un hueco
con la energía de disociación Lle.
En una muestra puramente intrínseca, en donde las concentraciones de huecos y
electrones son iguales, se pueden igualar las expresiones (9.3-6) y (9.3-15), tomar el
logaritmo de ambos lados de la ecuación resultante y resolver para la energía de
Fermi, lo cual da

(intrínseca). (9.3-22)

Puesto que Uv y Uc están dadas por (9.3-16) y (9.3-7), se puede expresar este
resultado en la forma

(intrínseca), (9.3-23)

usando el símbolo e¡¡ para denotar la energía de Fermi de un semiconductor intrín-


seco. De acuerdo con esto, es evidente que en un semiconductor intrínseco la ener-
gía de Fermi queda desplazada del centro del vacío de energía sólo por una canti-
dad relativamente pequeña de energía, según lo indica el segundo término del lado
derecho de (9.3-23). Si m;= m~, el nivel de Fermi se encuentra exactamente en el
punto medio de la región prohibida, como sr señaló con anterioridad.

9.4 ENERGIA DE IONIZACION DE CENTROS DE IMPUREZAS

Un centro donador de un semiconductor se compone de un icn fijo de carga


+e con el que está enluado débilmente un electrón. Si la energía de enlace es lo
Energía de ionización de centros de impurezas 293

suficientemente pequeña, la "órbita" del electrón será tan grande en comparación


con el espaciamiento interatómico, que la trayectoria del electrón alrededor del ion
donador 2 abarcará muchos átomos. En estas circunstancias, es correcto pensar que el
electrón está sumergido en un medio uniforme polarizable cuya constante dieléctrica K,
es la constante dieléctrica macroscópica del cristal semiconductor, ya que la fuerza elec-
trostática entre el ion donador y el electrón entonces se modificará en promedio, por la
polarización de los muchos átomos que intervienen. La representación es similar a la
de un átomo de hidrógeno dentro de un medio uniforme continuo, cuya constante
dieléctrica es " si se puede imaginar esta situación. Esta representación será válida
siempre y cuando K tenga tal magnitud que las órbitas de Bohr sean grandes en
comparación con el espaciamiento interatómico.
Ahora se puede calcular el tamaño de las órbitas y los niveles de energía
asociados de acuerdo con la teoría de Bohr que se vio en la sección 4.5. Sería más
exacto usar la mecánica ondulatoria del átomo de hidrógeno para estos cálculos;
pero puesto que se sabe que la teoría de Bohr y el promedio de la mecánica
ondulatoria de las distancias nucleares electrónicas son casi las mismas, se puede
confiar en que la teoría simple de Bohr dará respuestas adecuadas para esta situa-
ción que es muy similar. La condición de cuantización para la cantidad de movi-
miento angular orbital se aplica en ambos casos, de modo que la ecuación (4.5-2)
sigue siendo correcta, a condición de que la masa electrónica se substituya por m~.
Por otra parte, debido a la polarización del cristal, la fuerza electrostática entre el
ion donador y el electrón enlazado se reduce en un factor ", haciéndose e2 /Kr~, de
tal manera que la ecuación (4.5-3) ahora se debe escribir como sigue

(9.4-1)

A continuación, las ecuaciones (9.4-1) y (4.5-2) se pueden resolver como ecua-


ciones simultáneas para rn y wn, dando [(en analogía con (4.5-4) y (4.5-5)],

(9.4-2)

Wn=~li3
m:e
2
4
(9.4-3)
n K

Las energías cinética y potencial ahora se pueden evaluar como se hizo en


(4.5-6) y (4.5-7), recordando, sin embargo, que la energía potencial ahora está dada
por - e2/K.rn, por lo cual la energía total es

(9.4-4)

La teoría de Bohr para el átomo de hidrógeno se expresa mediante las ecua-


ciones anteriores con m~= m 0 y K = l. De acuerdo con (9.4-2), es ev.idente que las

2 Aunque describe la situación, esto no constituye un buen lenguaje de mecánica cuántica;


sería más exacto decir que la función de onda del electrón se extiende sohre muchas distancias
interatómicas, de tal manera que se incluyen muchos átomos dentro de la región en donde la
densidad de probabilidad es grande.
294 Semiconductores electrónicos uniformes en equilibrio

órbitas de Bohr para el centro donador son más grandes que las órbitas del hidm.
geno por un factor K y también por un factor m 0 /m~. Para el germanio tipo 11.
K= 16 y m~~ m 0 /4, de tal manera que el radio de la primera órbita de Bohr es 64
veces el radio de la primera órbita de Bohr del hidrógeno. El valor del hidrógeno ea
0.528A, de tal suerte que el valor para el átomo donador en el germanio es alredo-
dor de 34 A. En efecto, esto es considerablemente mayor que la distancia interáto-
mica (que es más o menos 2.44A para el germanio), de donde, esta representaciÓII
del centro donador está justificado en este caso desde el punto de vista físico.
La energía de ionización del centro donador, de acuerdo con (9.4-4), es menor
que la del átomo de hidrógeno por un factor 1/K 2 y también por un factor
m~/m 0 • Para el caso del germanio, esto representa (1/256) • (1/4) = 1/1024. Enton-
ces, podría esperarse que la energía de ionización para el estado basal de un átomo do-
nador sea aproximadamente 1000 veces menor que la del estado basal del átomo
de hidrógeno (13.6 eV). En consecuencia, se llega a la cantidad 0.013 eV para la
energía de ionización de un átomo donador en el germanio. Este valor concuerda
aceptablemente con los valores determinados en la práctica y que se obtuvieron
por la medición de concentraciones de portadores en función de la temperatura
y por la absorción óptica en el infrarrojo, según lo indica la tabla 9.1. Los valo-
res más elevados de energía de ionización observados para el silicio, se explican
en parte por la constante dieléctrica menor (K = 12) de este material, y en parte por
las masas efectivas más grandes de los electrones del silicio. Las características de los
centros receptores se pueden comprender siguiendo el mismo razonamiento, utilizan-
do una representación que comprenda un ion receptor negativamente cargado y un
hueco de carga positiva dentro de un medio dieléctrico uniforme.

TABLA 9.1.
Energías de ionización de centros donadores
y receptores en Ge y Si

Impureza Ge Si
p 0.012 eV 0.045 eV
As 0.0127 0.05
Sb 0.010 0.039
B 0.0104 0.045
Al 0.0102 0.06
Ga 0.0108 0.07
In 0.0112 0.16

Por tanto, se puede considerar que los electrones cedidos por átomos dona-
dores se originan en estados donadores localizados dentro del vacío de energía prohi-
bida, a unas cuantas centésimas de electrón volt por d•bajo de la banda de conduc-
ción. De igual manera se puede considerar que los huecos cedidos por los átomos
receptores se crean cuando los electrones, que normalmente deberían ocupar los
estados cercanos a la parte superior de la banda de valencia, se desplazan a niveles
receptores que estaban vacíos en un principio, y cuya energía se localiza a unas
cuantas centésimas de electrón volt por encima de la banda de valencia. Este patrón
de niveles donadores y receptores se ilustra en la figura 9.8(a). La representación
correspondiente de la densidad de estados aparece en la figura 9.8(b).
Estadística de los semiconductores con impurezas 295

E t Banda de conducción
Electrones
_ / de conducción
•e ""'""'~-=--=-~:.__-=--- Ee

----~Niveles donado::s
Electrones de la banda de valencia
que ocupan los niveles receptores

... L f /Niveles
_ _ _ _¿ _ r~eptores •.,
•• ••

Banda de valencia

(a) (b)

Figura 9.8. (a) Diagrama de bandas de energía de un semiconductor con impurezas indicando
los niveles donador y receptor, (b) curva correspondiente a la densidad de estados.

9.5 ESTADISTICA DE WS SEMICONDUCTORES CON IMPUREZAS

Antes de estudiar la mecánica estadística verdadera de los semiconductores con


impurezas, es necesario examinar una característica sutil de la estadística de ocupa-
ción de los niveles donadores y receptores. Si se confinara el estudio a los niveles
donadores uno se sentiría tentado a llegar a la conclusión de que la probabilidad de
ocupación asociada con dichos niveles estaría dada por la función de equilibrio de
Fermi (5.5-20), siendo e= ea. Sin embargo, esto no es del todo correcto, debido a
la degeneración del espín de los niveles donadores. Existen en realidad dos estados
cuánticos asociados con cada nivel de impurezas donadoras correspondientes a las
dos orientaciones del espín permisibles del electrón sobre el átomo donador. No
obstante, tan pronto como se ocupa uno de estos estados, se excluye la ocupación
del otro, ya que los requisitos de valencia del ion donador se satisfacen con un solo
electrón. Esta situación altera el problema estadístico que conduce a la función de
distribución.
Sea un sistema que tiene niveles de energía de este tipo, como se ilustra en la
figura 9.9. Se supondrá que los electrones que ocupan los niveles son partículas

No. nivel de energía 2 3 4


1------1 1----------11n

Energía ., •z .3 .4 ., ."
Degeneración g, 9z g3 g4 9¡ glt

No. de electrones N, Nz N3 N4 N¡ N"

Figura 9.9. Niveles de energía y notación usada en los cál..,ulos de la sección 9.5.
296 Semiconductores electrónicos uniformes en equilibrio

indistinguibles y que existen N¡ electrones en el iésimo nivel cuya degeneración es g¡.


El número de formas de insertar el primer electrón en los estados cuánticos pertene--
cientes al iésimo nivel, es g¡; el número de maneras de colocar el segundo es g¡- ~
dado que la ocupación del primer estado por el primer electrón excluye la ocupa-
ción del estado de espín opuesto; el número de maneras de insertar el tercero es
g¡- 4 y así sucesivamente. Para el iésimo, el número será g¡- 2N¡ + 2. El número
total de modos de arreglar N¡ electrones no distinguibles en g¡ estados, en estas
circunstancias, es

g¡(g¡- 2)(g¡- 4) ··· (g¡- 2N¡ + 2)


(9.5-1)
N¡!

El factor N¡! del denominador se incluye porque las distribuciones que son
idénticas a excepción de la permutación de los electrones entre ellas mismas no
deben contarse como distribuciones diferentes, ya que los electrones no son distin-
guibles unos de otros. El número total de formas de lograr una distribución en la
que se tengan N 1 , N 2 • • • N n electrones en los niveles 1, 2, • • • n, es el producto
de los factores de la forma (9.5-1) sobre los niveles del sistema. Esta es precisamente
la cantidad Q(N1 N 2 • • • Nn) del capítulo 5 [véase, por ejemplo, (5.5-3)]. Por tanto.
para este sistema se tiene

(9.5-21

La función de distribución resultante se determina maximizando In Qa como


antes, utilizando el método de los multiplicadores lagrangeanos que se desarrolló en
el capítulo 5, siendo el resultado

en donde Et es la energía de Fermi definida del modo acostumbrado. Para los


niveles donadores, el número de átomos donadores es la mitad de la cantidad de
estados de espín o sea, 1/2g¡, de tal manera que para este sistema se puede escribir

N-
n - d
(9.5-4)
d - 1 + te(~d E¡)/kT

en donde Na es la concentración de átomos donadores de impurezas, Ea es la


energía de los niveles donadores y na es el número de electrones por unidad de
volumen que ocupan los niveles donadores (es decir, la concentración de donadores
no ionizados). Evidentemente, la función de Fermi está modificada por la presencia
del factor 1/2 que va en el denominador antes del término exponencial.
De manera similar, se puede demostrar que si Na es la concentración de áto-
mos de impureza receptores y Ea la energía de los niveles receptores, la concentra-
ción de huecos asociada con Jos átomos receptores (o sea, la densidad de los sitios
receptores no ionizados) Pa, será

Pa = } + te<•! Ea)/kT •
(9.5-5)
Estadística de los semiconductores con impurezas 297

La densidad de estados asociada con los niveles donadores y receptores se


puede representar en términos de las funciones 8- de Dirac por medio de

(9.5-6)
y
(9.5-7)

Estas ecuaciones significan que no existen niveles donadores o receptores a


energías que no sean ea y ea, y que la cantidad total de estados cuántico donadores
y receptores por unidad de volumen es 2Na y 2Na, respectivamente.
Si la aproximación de Boltzmann es válida, tanto para la banda de conducción
como para los niveles donadores (es decir, si el nivel de Fermi está a varias unidades
kT por debajo de ea), el factor exponencial del denominador de la expresión en
(9.5-4) es mucho mayor que la unidad, y por ende, puede hacerse caso omiso de
este último; en donde, la ecuación (9.5-4) se puede escribir como

(9.5-8)

Puesto que la concentración de electrones en la banda de conducción está dada


por (9.3-6), se puede escribir la relación de na, el número de electrones asociado
con los donadores no ionizados, y n 0 + na, que es el número total de electrones
libres y débilmente enlazados como sigue

(9.5-9)

Ahora, ec - ea es la energía de ionización de los donadores que por lo general


es del orden de kT o un poco más pequeña; de donde, el factor exponencial
anterior es del orden de la unidad. Si Nv ~-!-Uc, la relación entre el número de
electrones en donadores no ionizados y el número total será muy pequeña. Puesto
que a 300°K Ue es del orden de 10 19 cm- 3 , esta condición se satisface a esa
temperatura para todas las concentraciones de impurezas donadoras que son redu-
cidas en comparación con esta cifra. En estos casos, es evidente que los donadores
están casi totalmente ionizados y por lo general es más conveniente y exacto proce-
der sobre la suposición de que su ionización es completa, haciendo que na sea igual
a cero. A temperaturas muy bajas, el factor exponencial de (9.5-9) puede ser apre-
ciablemente más pequeño que la unidad y el criterio para la ionización completa de
los donadores se debe escribir en la forma más general

(9.5-10)

De modo similar, a condición de que la aproximación de Boltzmann para los


huecos sea válida tanto para la banda de valencia como para los niveles receptores,
se puede demostrar que estos últimos quedan prácticamente ionizados por completo
siempre que

(9.5-11)

A menos que la temperatura sea muy baja, esto equivale al requisito Na ~tUv.
En casi todas las circunstancias el nivel de Fermi quedará dentro de la banda prohi-
bida, a muchas unidades kT lejos tanto de los niveles receptores, como de los
298 Semiconductores electrónicos uniformes en equilibrio

donadores, y las impurezas receptoras y donadoras que puedan estar presentes esta-
rán ionizadas casi por completo.
En un semiconductor en equilibrio debe haber un hueco térmico o un ion
donador positivamente cargado por cada electrón libre, y un electrón térmico o un
ion receptor negativamente cargado por cada hueco libre. Por tanto, todo el cristal
debe ser eléctricamente neutro. Esta condición de neutralidad eléctrica se puede
expresar igualando a cero la suma algebraica de todas las cargas negativas y positivas.
por lo cual (recordando que la concentración de los donadores ionizados es Na- na
y la de los receptores ionizados es Na - Pa),

(9.5-12)

Para todas las temperaturas, excepto las más bajas, y también para los valores
más elevados de concentración de impurezas, la aproximación de Boltzmann será
valida para las bandas de conducción y valencia, y también para los niveles dona-
dores y receptores, de donde, las concentraciones de donadores y receptores no
ionizados, Pa y na, se pueden omitir en (9.5-12), lo cual da

(9.5-13)

o bien, si se emplea (9.3-6) y (9.3-15),

(9.5-14)

Si se hace que

IX = e•¡/kT, Pe = e -•clkT y (9.5-15)

entonces, (9.5-14) se puede escribir en la forma

(9.5-16)

Al resolver esta ecuación cuadrática para o: y tomar el logaritmo del resultado,


se obtiene

(9.5-17)

Se debe escoger el signo positivo del radical de (9.5-17), ya que cuando Na=
Na =O, ee¡fkT debe ser una cantidad positiva. Esto se puede expresar de un modo
más satisfactorio haciendo notar que

(9.5-18)

Al utilizar esta relación y substiuir los valores dados por (9.5-15) para f3v y f3c.
(9.5-17) se puede expresar como sigue

(9.5-19)
Estadística de los semiconductores con impurezas 299

Como se puede ver de (9.3-23), los dos primeros términos del lado derecho de
esta ecuación representan el nivel de Fermi E¡¡ para un semiconductor intrínseco y,
ya que de acuerdo con (9.3-17) y (9.3-20), n¡=..JUcUve-i::.ef 2 kT, (9.5-19) se puede
escribir fmalmente como

e1 = e1 ¡ + kT se nh -l(Nd-2n¡Na) . (9.5-20)

~.---------------- ~---------------
., ----------
~----------------- ~"----------------

.. ---------
t'f - - - - - - - - - -

~-------------
(a) (tipo·nl (b) (tipo-p)
Figura 9.10. Posiciones relativas de los bordes de banda, nivel intrínseco de Fermi y nivel real
de Fermi en (a) semiconductores tipo n y (b) tipo p.

Esta expresión da el nivel de Fermi para un semiconductor con impurezas


dentro del rango en el que se satisface la aproximación de Boltzmann y los dona-
dores y receptores se pueden considerar como totalmente ionizados. Las cantidades
n 0 ,p 0 ,nd y Pa se pueden obtener fácilmente a partir de (9.3-6), (9.3-15), (9.5-4) y
(9.5-5) una vez que se ha determinado el nivel de Fermi.
Puesto que senh-lx es positivo para x >O y negativo para x <O, se ve clara-
mente que E¡> E¡¡ para semiconductores tipo n (Nd - Na > O) y E¡< E¡¡ para semi-
conductores tipo p (Nd -Na< 0), como se ilustra en la figura 9.10. Si la cantidad
de donadores y receptores es idéntica, la función senoidal hiperbólica inversa desapa-
rece y el material se comporta exactamente como un semiconductor intrínseco en lo
que respecta a las poblaciones de electrones y huecos. En estas condiciones, se dice
que las impurezas tipo n y p están plenamente compensadas. Si la densidad neta
de impurezas INd- Nai es mucho mayor que n¡, el número de portadores térmi-
camente excitados será pequeño en comparación con la cantidad total; en este caso,
el argumento de la función senoidal hiperbólica inversa de (9.5-20) es muy grande.
Puesto que senh- 1x ~±In 12xl para valores grandes de x, es obvio que en estas
circunstancias (9.5-20) se convierte en

(9.5-21)

en donde el signo más se usa para el material tipo n (Nd >Na), y el signo menos
para el tipo p (Na> Nd). Se dice que un material semiconductor de esta naturaleza
es un semiconductor fuertemente extrínseco y el rango de aplicabilidad de (9.5-21)
se cita a menudo como el rango extrínseco.
Por supuesto, la densidad de portadores en las bandas de conducción y valen-
cia se puede encontrar substituyendo la expresión (9.5-17) en lugar del nivel de
Fermi en (9.3-6) y (9.3-15). Se pueden determinar estas cantidades también en la
condición de neutralidad eléctrica (9.5-13), con la ayuda de (9.3-20). Por ejemplo,
cuando se substituye Po= nl/n 0 en (9.5-13), se obtiene

(9.5-22)
300 Semiconductores electrónicos uniformes en equilibrio

que se puede resolver para n 0 , dando

(9.5-23)

Para resolver la ecuación' cuadrática, es necesario seleccionar el signo positivo


para el radical, ya que el resultado debe reducirse a + n¡ para Nd =Na =O. Del
mismo modo, cuando se substituye n0 = n[ jp 0 en la ecuación de neutralidad de
carga, se puede demostrar que

(9.5-24)

De acuerdo con estas fórmulas, es evidente que cuando Nd- Na= O, no=-
Po =n¡. Este es el caso de la compensación total (o, si Nd =Na= O, de un semi·
conductor intrínseco). Si N d - Na >O, n 0 >Po como es de esperarse en un se·
miconductor de impurezas tipo n; si Nd -Na< O, Po > n 0 como se requiere en el
caso de un semiconductor tipo p. Para materiales fuertemente extrínsecos, estas
fórmulas se simplifican mucho. Por ejemplo, si Nd -Na;;» n¡, como sucede para una
muestra de un fuerte tipo n, entonces,

y (9.5-25)

en tanto que para un material fuertemente p, en donde Nd -Na es grande y nega-


tivo,

n~
y no~ N ~N. (9.5-26)
a d

Con el fin de conservar una generalidad total, se ha supuesto desde el principio


que están presentes tanto impurezas donadoras como receptoras. No obstante, en
muchos casos, sobre todo los relacionados con cristales en los que se han incorpo-
rado intencionalmente impurezas de un tipo, la concentración del otro tipo de im-
purezas puede desecharse por completo y, en efecto, igualarse a cero, en todas las
fórmulas de esta sección.

9.6 EL CASO DE LA IONIZACION INCOMPLETA DE NIVELES


DE IMPUREZA (TEMPERATURA MUY BAJA)

Es posible que a temperaturas muy bajas no exista la suficiente energía térmica


disponible para conservar la ionización completa de los niveles de impurezas dona-
doras y receptores como lo determinan los criterios (9.5-10) y (9.5-11). Por ejemplo,
a la temperatura del cero absoluto, en un semiconductor tipo n, los niveles donado-
res deben estar totalmente ocupados y la banda de conducción vacía por completo
de electrones. Estas dos condiciones no se pueden alcanzar a menos que el nivel de
Fermi quede entre los niveles donadores y la banda de conducción, como se rl~scribe
en la figura 9.11. En este .caso, la aproximación de Boltzmann ya no se puede usar
para describir la probabilidad de aplicación asociada con los niveles donadores, ya
que el nivel de Fermi se encuentra ahora más bien arriba que debajo de los niveles
de energía donadores. Sin embargo, la aproximación de Boltzmann se puede seguir
aplicando a los electrones de la banda de conducción debido a que el nivel de Fermi
El caso de la ionización incompleta de niveles de impureza 301

.t

., •• -r-----==.t

••
f 0 =O 1/2

Figura 9.11. Función de distribución en un semiconductor tipo n a temperatura muy baja.

pennanece a muchas unidades kT debajo de la base de la banda de conducción; en


relación a esto se debe recordar que kT es sólo aproximadamente 0.001 eV a 10°K.
Se analizará en detalle el caso de un semiconductor de tipo puramente n en
donde Na= O, y se supondrá que T es tan baja que puede eliminarse la concentra-
ción de huecos creados térmicamente. Por supuesto, ya que Na =O, Pa debe desva-
necerse también. Si se hace que Na = Pa =Po = O en (9.5-12), se puede escribir

(9.6-1)
Si se usa (9.3-6) y (9.5-4) para expresar n 0 y nd en esta ecuación, se obtiene

(9.6-2)

Sin embargo, puesto que

1- 1 1
1+ te.<•• .,¡¡kT- -:-1-+---=2-e--;:<•:-·-.:-,"Jtk..,.T' (9.6-3)

(9.6-2) se puede convertir en

(9.6-4)
Si se hace que

y (9.6-5)
(9.6-4) se convierte en

(9.6-6)
302 Semiconductores electrónicos uniformes en equilibrio

Esta ecuación se puede resolver para a de tal modo que dé

(9.6-7)

Se debe escoger el signo más para que a= e"tfkT sea positiva y, por ende, e1
sea real. Ahora, por definición,

(9.6-8)

--
Al tomar el logaritmo de ambos lados de (9.6-7), usando (9.6-8) y volviendo a
la notación original con (9.6-5), se puede obtener finalmente

e = -1 (e
f 2 e
+ e ) + -kT In _Nd -
d 2 2Ue
kT senh _ 1 (J Ue
_
8Nd
e _li•<flkT )
'
(9.6-9)

en donde !::.e¡ = Ec - ed es la energía de ionización de los donadores. La densidad de


los electrones libres en la banda de conducción se puede calcular a partir de (9.3-6).
En el cero absoluto, (9.6-9) da e1 = t(ec + ed), lo que significa que el nivel de
Fermi está a la mitad entre los niveles donadores y la banda de conducción. Al
aumentar la temperatura, el nivel de Fermi aumenta ligeramente (no obstante, per-
maneciendo por debajo de Ec) y luego decrece desplazándose hacia abajo por los
niveles donadores hacia el centro de la banda prohibida. Para temperaturas en que el
nivel de Fermi esté a varias unidades kT por debajo de la energía de los donadores
ed, punto en el que los donadores están casi completamente ionizados, la ecua-
ción (9.6-9) se reduce aproximadamente a (9.5-21). La prueba de este enunciado se
asigna como ejercicio al lector. Se puede demostrar de manera similar, que para
un semiconductor tipo p en estas mismas circunstancias, el nivel de Fermi a la
temperatura cero queda hacia la mitad entre los niveles receptores y la banda de
valencia y que, al aumentar la temperatura, se mueve primero un poco hacia abajo y
luego ascendentemente acercándose al valor dado por (9.5-21) conforme los niveles
receptores se ionizan por completo. En semiconductores tipo n y tipo p, el nivel de
Fermi tiende al valor intrínseco e¡¡ como lo establece (9.3-23) a temperaturas lo
suficientemente altas, ya que a una temperatura elevada, el número n¡ de porta-
dores térmicamente excitados tendrán un exceso notable en relación con el número
INd- Nal con el que contribuyen las impurezas donadoras y receptoras. Al exceder
este punto, el comportamiento del material será muy aproximado en todos los aspec-
tos al de un semiconductor intrínseco. No obstante, en algunos casos esta tempera-
tura de transición puede exceder el punto de fusión del semiconductor. El nivel de
Fermi, como lo determinan (9.6-9) en el rango de temperaturas bajas y (9.5-20) a
temperaturas elevadas, se ilustra como una función de temperatura para materiales
tipo n y tipo p en la figura 9 .12.

9.7 CONDUCTIVIDAD

La densidad de corriente debida a huecos y electrones es igual al producto de


su densidad de carga y velocidades respectivas. Por tanto, la densidad de corriente o
Conductividad 303

i., (T) i., (T)


-r
~r-------------------------

•• o -r
(o) tipo-n (b) tipo-p

Figura 9.12. Variación de la energía de Fermi en función de la temperatura para semiconduc-


tores (a) tipo n y (b) tipo p, de varias densidades de impurezas. Las curvas
marcadas con "1" corresponde!• a densidades de impurezas relativamente bajas, las
marcadas con "2" a densidades intermedias, y las marcadas con "3" a densidades
de impurezas relativamente altas.

la densidad de carga por unidad de tiempo transportada por huecos y electrones es

(9.7-1)
y

(9.7-2)

en donde Pn y Pp se refieren a las densidades de carga asociadas con las densidades


de electrones y huecos n y p, y Vn y vP son las velocidades vectoriales promedio de
los electrones y los huecos, respectivamente. Puesto que la velocidad electrónica
promedio es - J.LnE y la velocidad promedio de los huecos es J.LpE, en donde J.Ln y
J.Lp son las movilidades del electrón y el hueco y E es el campo, {9.7-1) y {9.7-2) se
puede escribir como sigue

(9.7-3)

(9.7-4)

por lo cual, la densidad total de corriente eléctrica 1 se puede expresar como

1 = e{nJ.Ln + PJ.Lp)E = aE. (9.7-5)

La conductividad eléctrica a está dada entonces por

(9.7-6)
304 Semiconductores electrónicos uniformes en equilibrio

Las movilidades P.n y P.p de las fórmulas anteriores se definen como

y (9.7-7)

en donde 1'n y Tp son los promedios ponderados de los tiempos de relajación 7 n


para electrones y 7 P para huecos sobre la distribución Maxwell-Boltzmann calculadas
como lo establece la ecuación (7 .3-12).
También se debe observar que n y p son los valores instantáneos reales de la
concentración de huecos y electrones que no necesariamente son idénticos a las
densidades de equilibrio de huecos y electrones n 0 y Po. Sin embargo, hasta ahora
se ha supuesto que no existen gradientes de densidad de portadores (que originarían
corrientes de difusión). Por supuesto, si las densidades de portadores son las relacio-
nadas con el estado de equilibrio, se descubrirá que

(9.7-8)

es el valor correspondiente de conductividad. Es necesario establecer esta distinción.


porque es posible crear densidades de portadores en exceso de los valores de equilibrio
en los semiconductores, como se verá más tarde.
Para un semiconductor intrínseco con densidades de portadores iguales a los
valores de equilibrio, n 0 = p 0 = n¡ y (9.7-8) se convierte en

(9.7-9)
en donde b se define como la relación entre la movilidad de los electrones y los
huecos, es decir,

b = /ln/ /lp· (9.7-10)

Si se usa (9.3-21), (9.7-9) se puede escribir en la siguiente forma

(9.7-11)

Puesto que la movilidad P.p tiene casi siempre una dependencia de la tempera·
tura que anula en su mayor parte la variación de temperatura '['3/ 2 del término que
precede al factor exponencial y, puesto que b no depende mayormente de la tem-
peratura, la variación anterior de a0 como una función de 1/T es esencialmente
exponencial. De donde, una gráfica semilogarítmica de a 0 en función de 1/T da una
línea recta con una pendiente fle/2k, y el valor de la banda prohibida !le puede
determinarse con mucha precisión valorando la pendiente de una gráfica experimen-
talmente medida de ln a 0 en función de 1/T en el rango intrínseco.
Para un semiconductor que no es necesariamente intrínseco, sino que tiene
densidades de huecos y electrones que corresponden a los valores de tquilibrio
n 0 ,p 0 , la conductividad está dada por (9.7-8). Usando (9.7-10) para ebninar P.n, y
luego substituyendo las expresiones (9.5-23) y (9.5-24) para n 0 y p 0 , la conducti-
vidad se puede escribir como

CTo = e¡lp (bno +Po)= e/lp [~ (b- l)(N 4 - Na)+ (b + l)J~(N4 - N 0)


2 + n/ J.
(9.7-12)
Conducdwdad 305

Temperatura en °K Temperatura en °K
33 3 20 4 14.3 10 18300 78 333 204 14 3 10
1000300 78 10
6
4

o
u
:e
•:::1
u
o
E ~

~
u

E
.e
'
-...

eQ)
u

.e o
a.

,
11
'C
·;:::
"'E'
"'u
Q)

"'::J "C
'C
e "'
E
o o
u "C

~
~

0001~----~----~----~----~----~
o 00<! 0.04 006 0.08 0.10 002 0.04 0.06 008 01
(a) 11 Temperatura en °K (b) t 1 Temperatura en °K

....
u

1
>
;:;...
E
u
eQ)
"C

~"' 10 4 ~---------------------------+~~~~~~
·:;
o
:¡¡;;
61

58 Nd ~ 10 11 cm-z
I0 3 ~~~~~~A---~~~~~------~--__J
10 20 30 40 50 60 80 100 200 300
(e) Temperatura en °K

Figura 9.13. (a) Conductividad eléctrica, (b) concentración de portadores y (e) movilidad de
electrones para una serie de muestras de germanio tipo n que cubren una amplia
variación de contenido de impurezas donadoras. [De acuerdo con E. M. Conwell,
Proc. I.R.E., 40: 1327 (1952).]
306 Semiconductores electrónicos uniformes en equilibrio

Véase ahora un semiconductor tipo n para el que Nd- Na es positivo. A tem-


peraturas bajas, n¡ ~Nd- Na, por lo que, de acuerdo con (9.7,12), a 0 ~ (Nd-
Na)beJlp = (Nd- Na)eJln, que es independiente de la temperatura, excepto en lo
que Jln pueda depender de T. Por tanto, el semiconductor es un material fuertemente
extrínseco y la mayoría de sus portadores se originan en los átomos de impure-
zas. Al aumentar la temperatura, n¡ aumenta con gran rapidez, de acuerdo con
(9.3-21), después llegará un momento en que será igual y luego sobrepasará a Nd-
Na. Para temperaturas tales que n¡';PNd -Na, (9.7-12) da a 0 ~eJlpn¡(b + 1), que
es el mislno valor dado por (9.7-9) para un semiconductor intrínseco. Entonces
la conductividad aumenta con gran rapidez al incrementarse la temperatura debido al rá-
pido aumento de n¡. La muestra es ahora básicamente un semiconductor intrínseco. La
transición entre estos dos extremos de comportamiento se produce a la temperatura en
que n¡ = Nd- Na. Al aumentar la densidad de impureza Nd- Na, esta temperatura de
transición aumenta y para diferentes substancias semiconductoras con la misma densidad
de impurezas, la temperatura de transición aumenta al incrementarse la banda prohibida
/),¡¿ ya que la temperatura necesaria para generar una densidad dada de portadores intrín-
secos aumenta con /),¡¿_ Se puede demostrar que se sigue el mismo comportamiento cuali-
tativo de (9.7-12) en los materiales tipo p, en cuyo caso Nd- Na es negativo. En la
figura 9.13 se ilustra una gráfica semilogarítmica de la conductividad en función de 1/T
como lo predice (9.7-12) para·varias muestras con diferentes contenidos de impurezas.
A temperaturas extremadamente bajas (menos de aproximadamente 30°K), no
existe la suficiente energía térmica disponible para mantener la ionización de los
niveles donadores y receptores. En este rango de temperatura, la conductividad des-
ciende de nuevo con rapidez al reducirse la temperatura, conforme los electrones
libres y los huecos se "congelan" de las bandas de conducción y valencia hacia los
niveles donadores y receptores. En cristales con una densidad de impureza muy
elevada, las funciones de onda de los electrones de átomos donadores cercanos o
huecos de átomos receptores cercanos pueden superponerse apreciablemente. El re-
sultado de esto es la ampliación del nivel donador o receptor a una banda angosta
de energía, al igual que los niveles atómicos de energía se ensanchan para formar
una banda en la aproximación de enlace filme, conforme las funciones de onda
electrónicas de átomos vecinos comienzan a superponerse. Puesto que existe el doble
de estados en estas bandas que electrones (o huecos), se puede observar una pequeña
conductividad residual de la banda de impllrezas en la banda de impurezas parcial-
mente llena en la región de temperaturas extremadamente bajas, en donde los elec-
trones y los huecos se "congelan" de las bandas de conducción y valencia hacia los
niveles donadores y receptores.

9.8 EL EFECTO DE HALL Y LA MAGNETORRESISTENCIA

En la seccwn 7.6 se estudió el efecto de Hall en los gases de electrones libres


para el caso en que los electrones y los huecos tienen la misma componente de
velocidad x. Este análisis conduce a la expresión

(9.8-1)

para el campo transversal de Hall, en donde ! 0 es la densidad de corriente, B 0 la


inducción magnética y R la constante de proporcionalidad denominada coeficiente de
Hall. En la figura 7.3 se ilustra la orientación de la muestra, la corriente y los
El efecto de Hall y la magnetorresistencia 307

campos. En el caso sencillo que se vio en la sección 7 .6, en donde se supuso que
los portadores de carga eran electrones, se obtuvo la expresión

1
R=-- (electrones) (9.8-2)
n0ec

para el coeficiente de Hall. De acuerdo con el análisis de la secc10n 7.6, se ve


claramente que si los portadores de carga son huecos positivos, cuya concentración
es p 0 , la expresión para el coeficiente de Hall sería

1
R=- (huecos). (9.8-3)
Poec

Y a se señaló que el efecto de la distribución de velocidades se despreció al


obtener estos resultados. Ahora se incluirá el efecto de la distribución de velocidad
para volver a determinar el coeficiente de Hall de un semiconductor. Además, hay
que tener en cuenta que en un semiconductor pueden estar presentes simultánea-
mente portadores de carga positivos y negativos.
Además de estos efectos que tienen un interés inmediato para este estudio,
existen otras dos complicaciones que se deberán resolver eventualmente. Hasta ahora,
en todos los cálculos de población de portadores y transporte que se han llevado a
.:abo, siempre se ha supuesto que las superficies de energía constante dentro del
espacio de la cantidad de movimiento o espacio k, eran esféricas. Esta suposición se
0rigina naturalmente cuando el valor mínimo de energía en la zona reducida de
Brillouin ocurre en el punto central k = O. Sin embargo, existen substancias, inclu-
yendo al germanio y al silicio (sólo en las bandas de conducción), en las que el
mínimo de energía se produce, no en el origen, sino en un grupo de puntos cristalo-
gráficamente equivalentes en otras partes de la zona de Brillouin. En tales casos, las
superficies de energía constante en las cercanías de los mínimos de energía pueden
ser elipsoidales más bien que esféricas. Esto introduce una anisotropía en la masa
~fectiva asociada con cada elipsoide; aunque los portadores se comportan como par-
tículas libres en el sentido de que la variación de e con k es parabólica en cualquier
dirección de movimiento, tienen una masa efectiva diferente a lo largo de cada una
de estas direcciones. A pesar de que la anisotropía en las propiedades de transporte
se pierde cuando se suman los elipsoides de energía asociados con todos los puntos
mínimos de energía, el procedimiento para computar los factores de densidad de
~stados y promediar las propiedades de transporte sobre las velocidades, se debe
modificar para tener en consideración esa configuración diferente de las superficies
de energía constante.
Además de esto, las bandas de valencia del germanio y el silicio se componen
realmente de dos bandas distintas superpuestas en donde cada una de éstas se asocia
.:on una masa efectiva distinta. Aunque las superficies de energía constante para
estas dos bandas son aproximadamente esféricas cerca del punto máximo en k = O,
existen en realidad dos especies de huecos presentes (huecos "ligeros" y huecos
··pesados" correspondientes a las dos masas efectivas) en forma simultánea.
Cualquier teoría de procesos de transporte que intente explicar a fondo los
abundantes datos experimentales que existen en este campo en relación con el ger-
manio y el silicio, debe necesariamente tener en cuenta estas dos complicaciones
adicionales. Sin embargo, para principiar será suficiente ampliar el cuadro del efecto
de Hall y los fenómenos relacionados con el mismo, para cubrir de un modo simul-
táneo a huecos y electrones e incluir el efecto de la distribución de velocidades. Por
tanto, se seguirá suponiendo que se maneja un semiconductor simple con superficies
-ie energía esféricas tanto en la banda de conducción como en la de valencia y que
308 Semiconductores electrónicos uniformes en equilibrio

sólo se tiene una variedad de electrones y huecos. Más tarde se indicará cómo estos
resultados se puede ampliar para admitir las dos dificultades adicionales que se aca-
ban de mencionar.
En primer lugar se considerará un solo tipo de portador (se escogió a los
huecos) y se incorporará el efecto de la distribución de velocidad. La forma más
evidente para proceder es a partir de la ecuación de Boltzmann con el término de la
fuerza de Lorentz (7.6-2). No obstante, es más sencillo y provechoso utilizar otro
método 3 que principia con la ecuación de movimiento para un hueco en presencia
de un campo eléctrico uniforme E y una inducción magnética uniforme 8 0 . Esta
ecuación se puede escribir como sigue

* dv
F = mP -d = eE + -ee v X B0 • (9.8-4)
t

Si se supone que la muestra, la corriente y el campo magnético están orien-


tados como se indica en la figura 7.3, es obvio que B0 tiene sólo una componente z
y (9.8-4) se reduce a dos ecuaciones para las componentes x y y de la velocidad,
que tienen la forma

(9.8-5)

(9.8-6)

en donde
roll = eB0 /m;c. (9.8-7)
Este conjunto de ecuaciones se puede resolver más fácilmente multiplicando
(9.8-6) por el número imaginario i y sumando el resultado a (9.8-5). Mediante este
procedimiento se obtiene una sola ecuación

dV e8
-+
dt
iro 0V = -
m*p
(9.8-8)

en donde las cantidades complejas V y 8 se defmen mediante

V= v,. + iv7 y 8 =E,.+ iE,. (9.8-9)


La ecuacton (9.8-8) se resuelve fácilmente multiplicando los dos lados por
&wot. El lado izquierdo se puede expresar como la derivada en el tiempo de
Veiwot, y la ecuación resultante se integra con respecto al tiempo para dar

1 1 e8 .
V t> too = - - e•toor + C (9.8-10)
. 0mP*
1ro

3 Véase, por ejemplo, H. Brooks, Advances in Electronics and Electron Physics, Nueva
York: Academic Press, Inc. (1955), Vol. VII, página 127 ff.
El efecto de Hall y la magnetorresistencia 309

en donde e es una constante de integración. Si se hace que V0 = Vxo + ivyo sea el


valor de V en t = O, e se puede evaluat en términos de V0 a partir de esta
ecuación, lo cual permite escribir {9.8-10) como

V = V.oe-imot + ~* {l _ e-iwot) (9.8-11)


o
1w0 m, o

Esta expres10n se debe promediar primero sobre la distribución exponencial de


tiempos de relajación, lo cual da, en analogía con (7.2-13).

f'x' V(t)e- 11'' dt


(V) Prom. _Jo
- oo
_
-
1

[V.o+ e~t,]
* , (9.8-12)
sobre t
fo e-1/•, dt 1 + IC.Oot, m,

en donde 7 P representa el tiempo de relajación para huecos. A continuación se


deberá promediar esta expresión sobre la distribución Maxwell-Boltzmann de veloci-
dades. Como siempre, se supondrá que 7 P es una función de la magnitud v; pero es
independiente de la dirección, es decir, isotrópica, de donde los promedios asociados
con el primer término de (9.8-12) siempre darán un promedio de una función sólo
de la magnitud de v por una componente Vxo ( = v0 sen cos cf>) o Vyo ( = e
v0 sen e sen cf>). Un promedio de esta naturaleza será siempre cero ya que la integral de
la expresión resultante sobre la coordenada azimutal cf> siempre se desvanece. Por
tanto, en este estudio se puede omitir por completo de este término. Si se separa el
segundo término anterior en sus partes real e imaginaria, la parte real se puede
identificar como Vx y la imaginaria como vy, de acuerdo con (9.8-9). De donde, se
obtiene

(9.8-13)

y ésta es la expresión que se debe promediar sobre la distribución de Boltzmann para


obtener los valores promedios de Vx y Vy. En la sección 7.3 se vio, utilizando la
ecuación de Boltzmann, que si .a:(v) es la cantidad que se va a promediar, el pro-
medio correcto que se debe sacar es

(9.8-14)

Si no se tiene un campo magnético, entonces, en la expresión (9.8-13), w 0 =O


y la ecuación da simplemente las velocidades vx y vy en función de los campos
eléctricos Ex y Ey. En este límite, la ecuación debe concordar con (7.3-11) y, en
efecto, lo hace, a condición de que 7 P se promedie de acuerdo con lo establecido
en {9.8-14). En realidad, como caso general, todos los promedios se deben calcular
de esta manera, lo cual conduce a

(9.8-15)
310 Semiconductores electrónicos uniformes en equilibrio

en donde

(9.8-16)

- - e -r:P -r:P
v, = lm(V) = ---;¡; [ ( 1 2 2) E-, - Wo ( 1 2 2 2 ) Ex ] . (9.8-17)
mP + w 0 -r:P + w 0 -r:P
Las componentes x y y de la densidad de corriente, en la forma acostumbrada
pueden expresarse como

y (9.8-18)

Como se ilustra en la figura 7.3, en t>l arreglo experimental acostumbrado, la


componente y de la corriente es cero, de donde, de acuerdo con (9.8-17),

(9.8-19)

Al substituir esto en (9.8-16), se obtiene finalmente

(9.8-20)

Si rp es independiente de v, entonces f(rp) =f(rp) y las ecuaciones anteriores


se reducen a los resultados simples e intuitivos

(9.8-21)

(9.8-22)

que concuerdan con (7.3-14) al igual que con (9.8-1) y (9.8-3). Es obvio que la
simple expresión del coeficiente de Hall obtenida anteriormente, es correcta aun
cuando exista una distribución de velocidades de Boltzmann, a condición de que T
sea independiente de la velocidad. También es evidente en (9.8-21), que en este caso
la conductividad eléctrica es independiente del campo magnético, es decir, no existe
una magnetorresistencia.
Sin embargo, generalmente T P depende de la velocidad y, entonces estos resul-
tados ya no son correctos. En tales circunstancias, es más conveniente establecer la
suposición de simplificación que consiste en que w 0 T P ~ l. Esta condición se satis-
Tará mejor para valores pequeños de inducción magnética y valores también pequeños
de T P que casi siempre se asocian con temperaturas más altas. La condición se
satisface normalmente en la mayoría de las substancias en las condiciones experi-
mentales comunes hasta el rango de la temperatura del nitrógeno líquido, aunque
también es muy posible violarla, si esto es lo que se desea. Por ejemplo, si B 0 =
10,000 oersteds, T ,, =- JO- 12 seg. (correspondiente a una movilidad del orden de
El efecto de Hall y la magnetorresistencia 311

2000) y m;= m 0 , entonces, WoTp::::: 0.2. En este caso, el requisito quedaría margi-
nalmente satisfecho; pero campos más altos y tiempos de relajación mayores darían
como resultado su violación. Si se supone que la condición es aplicable, se puede
hacer caso omiso de la cantidad w~T~ en (9.8-20) en comparación con la unidad.
De donde [expresando w 0 media..tlte (9.8-'i')j, ~::sta expresión se puede escribir como
sigue

(9.8-23)

en donde a 0 = p 0 e 2 rp/m;. Ahora parece que la conductividad eléctrica depende


del campo magnético; a este efecto se le conoce como magneto"esistencia. Se puede
demostrar que el segundo término entre paréntesis angulares de la expresión anterior
es siempre positivo, de tal modo que la conductividad se reduce invariablemente por
acción del campo magnético. La ecuación (9.8-23) se escribe con mayor frecuencia
de un modo diferente; resolviendo para Ex en función de lx y observando que
tl - w~r~)- 1 ::::: 1 + w~r~ para w 0 r P ~ 1, se puede obtener

(9.8-24)

en donde Po = 1/a0 es la resistividad de campo cero. El coeficiente de magneto"e-


sistencia se define entonces como

(9.8-25)

De acuerdo con (9.8-24), es evidente que la magnetorresistencia longitudinal de


campo pequeño predicha por estas ecuaciones, es proporcional al cuadrado de la
inducción magnética B 0 • Desde el punto de vista físico, el efecto de la magnetorre-
sistencia se debe al hecho de que el campo magnético desvía las partículas de un
modo ascendente o descendente a lo largo del eje y, en una dirección normal a la
dirección del vector de corriente. Las trayectorias resultantes son más bien curvas
que rectas y la distancia promedio de arrastre a lo largo de la dirección del flujo de
la corriente entre colisiones, por ende, se reduce.
Si se emplea la misma aproximación en (9.8-19), el campo de Hall Ey se
convierte en

(9.8-26)

En esta ecuacwn, el campo Ex se puede expresar con exactitud aceptable


como lx/a0 , y el término magnetorresistente de (9.8-24) es pequeño en comparación
con el término de campo cero para w 0 r P ~ l. Al substituir este valor junto con las
expresiones para a 0 y w 0 en (9.8-26), se obtiene

E,= RB0 lx (9.8-27)


312 Semiconductores electrónicos uniformes en equilibrio

en donde [recordando (9.8-14)] el coeficiente de Hall R está dado por

1 t2 1 (v 2 )(v2 t 2 )
R=----P-=-- P (9.8-28)
Poec (ip) 2 p 0 ec (v 2 tp) 2 •

El coeficiente de Hall lo modifica el factor (~)/(7p) 2 en relación con el valor


dado por la teoría del capítulo 7. También es evidente que el valor dado por
(9.8-27) es un valor de campo pequeño que sólo es bueno en tanto que w 0 r P <a¡; 1; si
w 0 r P iguala o excede a la unidad, el término de magnetorresistencia de (9 .8-241
sería de magnitud comparable al término de campo cero y ya no se podría reem-
plazar Ex por lx/a 0 en (9.8-26). Ex tendría que expresarse como lx/a, en donde o
tiene una fuerte dependencia en función del campo magnético. El coeficiente de Hall
entonces presentaría una marcada dependencia en relación al campo magnético. La
extensión de estos análisis al caso en que w 0 r ya no sea pequeño en comparación
con la unidad, implica muchos cálculos numéricos que no se efectuarán aquí. En el
análisis anterior se supuso que los portadores de carga eran huecos. El resultado para
un espécimen tipo n, en donde los portadores de carga son electrones, se puede
obtener substituyendo en todos los puntos e por -e. Se debe hacer notar que
cuando esto se hace, la frecuencia característica (9.8-7) se convierte en - eB 0 /m~c.
y por tanto, también se debe substituir w 0 por - w 0 . De esta manera se puede
asegurar que cuando los portadores son electrones, se cambia el signo de coeficiente
de Hall; pero la forma de los coeficientes de conductividad y magnetorresistencia
queda igual.
Si el proceso de dispersión dominante es la dispersión de red de modo acús-
tico, de acuerdo con los resultados de la sección 7.5, la trayectoria libre media será
básicamente independiente de la velocidad, por lo que Tp(v) = "A.p/v. De donde, es
evidente que (v 2 r ~> = ('A.~) = A.~; también, de acuerdo con (7 .3-12) y (7 .3-18), se
observa que (v 2 ) = 3kTfm y (v-zr p> = A.p<v> = A.pC, en donde e esta dada por (5.4-20).
Si se substituyen estos valores en (9.8-28), se obtiene r~/(7p) 2 = 3rr/8, y el coefi-
ciente de Hall se convierte en

3n 1
R=-- (tipo-p)
8 p0 ec

3n 1 (9.8-29)
=---- (tipo-n ).
8 n0 ec

El coeficiente de magnetorresistencia no se puede expresar en forma tan sim-


ple, porque diverge la integral requerida para evaluar T~ y es necesario un plantea-
miento más exacto. Esta divergencia se puede evitar señalando que para la disper-
sión de red, r se hace muy grande a velocidades bajas, en tanto que para la dispersión
por impurezas sucede exactamente lo contrario. Entonces, lo que sucede es que por
debajo de cierta velocidad, la dispersión de impurezas y no la de red es la que se
convierte en el factor dominante y para estas velocidades (a las que se encuentra la
divergencia), los promedios se deben calcular basándose en la relación tiempo de
relajación, en función de la velocidad asociada, con la dispersión de impurezas en
lugar de la que se asocia con la dispersión de red. Por tanto, se podría esperar que
la magnetorresistencia se vea afectada enormemente por pequeñas contribuciones de
la dispersión de impurezas. En efecto, este es el caso. También puede esperarse que,
sobre estas bases, el análisis que da el coeficiente de Hall suponiendo solamente la
dispersión de red, sea inválido en la región en donde r P está limitado por la disper-
sión de impurezas como en realidad sucede. En este caso no existe una divergencia
El efecto de Hall y la magnetorresistencio 313

en los promedios relacionados con este rango de velocidad. A menos que la densidad
de impurezas sea alta o la temperatura muy baja, la fracción de portadores dentro
del rango de velocidades bajas es muy pequeña y el resultado (9.8-29) no se afectará
mucho.
Ahora se verá un cristal semiconductor que no es fuertemente extrínseco, pero
que contiene electrones libres y huecos en concentraciones importantes. En este
caso, los huecos y los electrones, se pueden considerar por separado, utilizando
exactamente los mismos métodos que se emplearon antes para derivar las ecuaciones
(9.8-16) y (9.8-7). Entonces, las componentes de velocidad de los huecos y los
electrones se expresan como ecuaciones que tienen la forma de (9.8-16) y (9.8-17),
siendo las componentes de velocidad vpx y Vpy de los huecos idénticas a estas
ecuaciones, en tanto que las componentes de velocidad de los electrones Vnx y Vny
están dadas por ecuaciones en las que e se substituye por medio de -e, m; por
m~, r P por r n (en donde el último símbolo se relaciona con el tiempo de relaja-
cwn para los electrones que están dentro de la banda de conducción) y eB 0 /m;c
por - eB 0 /m~c. Si también se supone que w 0 r <;¡; 1 tanto para huecos como para
electrones, de tal manera que el término w~r 2 pueda desecharse en los denomina-
dores de los promedios, las componentes de la corriente se pueden expresar como
sigue

(9.8-30)

en donde
eB
0 eB0
Won =-.-
m"C
y Wop = -.-.
m,c
(9.8-32)

Si se usa (9.7-7) para eliminar las masas efectivas, y se reacomodan los tér-
minos, las ecuaciones anteriores pueden aparecer enJa forma

1" = noeJ.LnEE"- EyW0 n('r;/'rn)- E.xro:n(t!/tn)J

+ p0 e¡.t,[E.x + Eyw ,(r;¡:c")- E.xw:,(r!tt,)],


0 (9.8-33)
y

(9.8-34)

Dado que el voltaje de Hall se mide en condiciones de circuito abierto, ly = O,


como antes, de donde, (9.8-34) se reduce a

t2 t2
p n
PoJ.L,Wop ::- - noJlnWon ::-
E = r, t". E (9.8-35)
y noJln + Pollp "
314 Semiconductores electrónicos uniformes en equilibrio

Al substituir esta expresión de nuevo en (9.8-33), después de algunas opera-


ciones algebraicas se obtiene

en donde a0 , como siempre, está dado por (9.7-8). El término de la magnetorresis-


tencia es ahora mucho más complejo; pero sin embargo, es pequeño en comparación
con el valor de campo cero a condición de que Won T n .~ 1 y Wop T p <{ l. El campo
de Hall está dado por (9.8-35) y el coeficiente de Hall de campo pequeño se puede
obtener reeemplazando Ex por fx/a 0 , como se hizo antes, y en donde la diferencia
entre a y a 0 según se representa mediante el término de magnetorresistencia, es
despreciable en estas condiciones. Al expresar Won y w 0 p mediante (9.8-32) y
eliminando las masas efectivas en favor de las movilidades y los tiempos de relaja-
ción por (9.7-7), se obtiene

(9.8-37)

en donde, como siempre, b = llnlllp·


Esta expresión da el coeficiente de Hall en un semiconductor no extrínseco. Se
ve que se reduce a (9.8-29) cuando Po ~ n 0 o n 0 ~Po. Si el proceso de dispersión
dominante para huecos y electrones es la dispersión de fonones de modo acústico, 4
T'!/(7n) = ~/(7p) 2 = 3rr/8 como se demostró anteriormente y, en este caso,
2

(9.8-37) da

(9.8-38)

Para un semiconductor intrínseco, Po = n 0 = n¡ y (9.8-38) se reduce a

3n 1 1 - b
R=---- (Intrínseco). (9.8-39)
8 n¡ec 1 + b

Para p 0 ~ n 0 , el coeficiente de Hall según lo da (9.8-37), es positivo y para


n 0 ~ p 0 es negativo. Se requiere una inversión del signo del coeficiente de Hall para
valores de p 0 y n 0 para que se desvanezca el numerador de (9.8-37). Si se satisfacen
las condiciones en las que (9.8-38) es válida, esta inversión del signo del campo de
Hall se produce cuando Po = b 2 n0 • Puesto que n 0 p 0 = n[, esto representa, sencilla-
*
mente, Po = bn¡ o bien, n 0 = n¡/b. Si b 1, el punto de inversión no coincidirá exacta-
mente con el punto intrínseco. Por ejemplo, para b > 1, se tendrá un rango de
concentración de portadores dentro del cual el signo del coeficiente de Hall es
negativo a pesar del hecho de que la muestra sea tipo p.

4 A pesar de que la fórmula (9.8-38) se usa con mucha frecuencia para analizar mediciones
de Hall en materiales no extrínsecos, estas condiciones no siempre quedan estrictamente satisfe-
chas, sobre todo debido a la presencia de una dispersión de fonones de modo óptico.
El efecto de Hall y la magnetorresistencia 315

Además de cualquier interés fundamental que pueda despertar, el efecto de


Hall es importante debido a que permite un método práctico para saber si una
muestra es tipo n o tipo p y para determinar la concentración de los portadores.
Cuando se combina con mediciones de la conductividad, el efecto de Hall puede
usarse también para determinar la movilidad de los portadores de carga. En muestras
que son sumamente extrínsecas y en las que el mecanismo de dispersión predomi-
nante es la dispersión con fonones de modo acústico, de (9.8-29) es claro que la
medición de R se puede emplear directamente para obtener n 0 o p 0 y el tipo de
conductividad se obtiene del signo de R. Si hay otros mecanismos importantes de
dispersión, entonces, por supuesto, para obtener una medición absoluta de la concen-
tración de portadores, se debe conocer la cantidad ? /(7) 2 asociada con el meca-
nismo dominante de dispersión y, para poder evaluarla, es necesario saber la forma
en que r varía como función de la velocidad. No obstante, el factor ?/(7) 2 no es
mucho mayor ni mucho menor que la unidad para cualquier proceso de dispersión
conocido que se produzca en la práctica, de tal modo que la medición de la concen-
tración de portadores que sea exacta dentro de aproximadamente un factor de dos,
se puede obtener siempre, cualesquiera que sean los mecanismo de dispersión y, CO!l
frecuencia esto es todo lo que se requiere.
La movilidad de los portadores de carga en muestras extrínsecas se obtiene
eliminando la concentración de portadores entre la expresión (9.8-28) y la ecuación
a 0 =PoeJlp que se deriva de (9.7-8) cuando se hace caso omiso de la concentración
de los portadores minoritarios (en este ejemplo, los electrones). Para un semicon-
ductor tipo p, el resultado es

(9.8-40)

Para un semiconductor extrínseco tipo n, se puede demostrar también que

(9.8-41)

El producto ± cRa 0 a menudo se define como la Movilidad de Hall, de donde,

ILHn = -cRao (tipo-n)


ILHp = cRa 0 (tipo-p). (9.8-42)

Las ecuaciones (9.8-40) y (9.8-41) se pueden escribir, entonces como sigue

llp = ILHp((ip) 2 /~) (9.8-43)

(9.8-44)

Las cantidades llp y Jln son las verdaderas movilidades de arrastre o movili-
dades de conductividad; por otra parte, la movilidad de Hall es simplemente una
cantidad con las dimensiones de la movilidad que se obtiene a partir de cantidades
que son muy fáciles de medir en la práctica. Se debe conocer el factor (7)2 /r 2 para
convertir la movilidad de Hall en la de arrastre real. Sin embargo, puesto que este
factor rara vez se aleja mucho de la unidad, la movilidad de Hall da una indicación
316 Semiconductores electrónicos uniformes en equilibrio

aproximada de la verdadera movilidad donde el error producido en la mayoría de los


casos se origina en el propio experimento. Las mediciones experimentales de la
concentración de portadores y la movilidad de Hall de electrones para muestras de
germanio tipo n, en función de la temperatura, se ilustra en la figura 9.11 para una
gran variedad de concentraciones de impurezas donadoras.
En el caso de muestras no extrínsecas, se procede más o menos en la mi~
forma. A partir de (9.8-37) o (9.8-38), se puede eliminar n 0 o Po por medio de la
relación de acción de las masas n 0 p 0 = n~.
1
La ecuación resultante que expresa a n0
o p 0 en función de R es de cuarto grado y no se puede resolver analíticamente de
un modo sencillo, sino que se debe resolver en cada caso por métodos aproximados
o numéricos. Además, existe una ambigüedad en el hecho de que se tienen dos
raíces reales en lugar de una. Esto se observa en la figura 9.14, en donde el coefi-
ciente de Hall se ha graficado en función de p 0 ; para un valor dado de R existen
siempre dos valores posibles de Po. No obstante, en la práctica es bastante sencillo
seleccionar cuál de las raíces es la correcta haciendo una serie de mediciones del

OOin; -Po
(escala logarítmica)

Figura 9.14. Coeficiente de Hall de un cristal semiconductor en función de la concentración de


huecos.

efecto de Hall sobre una gran variedad de temperaturas. Además, para obtener las
concentraciones de portadores mediante el procedimiento anterior, es necesario co-
nocer la relación de movilidades b. Esto se puede obtener haciendo mediciones
independientes de la movilidad de Hall en muestras sumamente extrínsecas tipo n y
tipo p o bien, a partir de los resultados de las mediciones de arrastre de portadores
en exceso que se verá más tarde. Si n 0 y p 0 se obtienen del coeficiente de Hall, y
si se conoce la relación llnfllo = b, la movilidades Jln y Jlp se pueden determinar
basándose en los datos de conductividad, según la expresión (9.7-8).

9.9 RESONANCIA DE CICLOTRON Y SUPERFICIES


ELIPSOIDALES DE ENERGIA

Se puede hacer que los electrones y los huecos de los semiconductores exhiban
una resonancia en presencia de un campo magnético fuerte y constante (que se
supondrá sobre el eje z) y una pequeña radiofrecuencia osciladora transversal o
Resonancia de ciclotrón y superficies elipsoidales de energía 317

campo electromagnético de microondas cuyo vector eléctrico queda en el plano xy.


Las órbitas resultantes de los huecos o los electrones son circulares en la resonancia
y la energía se absorbe del campo de radiofrecuencia cada medio ciclo, como en un
ciclotrón. En efecto, la situación es precisamente análoga a lo que sucede con par-
tículas nucleares cargadas dentro de un ciclotrón y, por esta razón, el fenómeno se
denomina resonancia de ciclotrón.
Primeramente se investigará el caso de las superficies esféricas de energía y una
sola masa efectiva escalar. La fuerza de Lorentz sobre un hueco (y se estudiarán los
huecos de una muestra tipo p en este cálculo en particular), está dada por {9.8-4).
Si la masa efectiva m; es independiente de la dirección y si se supone que el vector
eléctrico del campo oscilante, cuya frecuencia es w, vibra a lo largo de la dirección
x, entonces,

(9.9-1)
mientras que

Bx = B, =O, (9.9-2)
y las componentes de la fuerza de Lorentz dan, para las ecuaciones de movimiento,

(9.9-3)

(9.9-4)

(9.9-5)

Al escribir estas ecuaciones se supuso que el vector magnético del campo de


radiofrecuencias es despreciable en comparación con el campo constan te 8 0 • La
ecuación de la componente z {9.9-5) se limita a indicar que la partícula se desplaza
a velocidad constante sobre la dirección z; esto carece de interés especial y no será
necesario hablar más al respecto. Las ecuaciones de la componente x y y se pueden
escribir como sigue

d 2x dy eE0 1...,
-=c.o -+-e (9.9-6)
dt 2 0 dt m* ,
(9.9-7)

en donde w 0 es la misma frecuencia que define (9.8-7) en conexión con el efecto


de Hall.
Si se suponen soluciones oscilatorias de la forma x =x 0 &wt y y =y 0 eiwt
estas ecuaciones se reducen a

(9.9-8)
318 Semiconductores electrónicos uniformes en equilibrio

(9.9-9)

que se pueden resolver para las amplitudes x 0 y Yo para dar

eE0 /m;
Xo = 2 2 (9.9-10)
Wo - w

iw 0 iw 0 eE 0 / m;
Yo = - Xo = ( 2 (9.9-11)
w w Wo - w 2)'

Cuando w = w 0 = eB 0 /m;c, se produce la resonancia y las amplitudes se hacen


muy grandes. La frecuencia de resonancia w 0 se denomina a menudo frecuencia de
ciclotrón. Evidentemente, si w 0 se mide de un modo experimental y si la inducción
magnética B 0 se conoce con precisión, se puede determinar la masa efectiva m;. En
la práctica, el efecto de la resonancia de ciclotrón constituye uno de los mejores
métodos para medir las masas efectivas. De acuerdo con (9. 9-l O) y (9 .9-ll ), se
observa que conforme w -+ w 0

(9.9-12)
de donde,
(9.9-13)

(9.9-14)

Entonces, en la resonancia, x(t) y y(t) son vibraciones armomcas ortogonales


con la misma amplitud y con una diferencia de fase de 90°. Se puede ver con
facilidad que la trayectoria de la partícula resultante, que representa la órbita del
hueco, es circular.
En la práctica, la resonancia se observa normalmente midiendo el factor Q de
una cavidad resonante de microonda mientras se hace variar el campo magnético B 0
(y, por ende, la frecuencia w 0 ). Cuando w 0 es igual a la frecuencia de excitación de
microondas, se obtiene una disminución brusca en el valor de Q de la cavidad, ya
que en la resonancia se absorbe una gran cantidad de la energía del campo electro-
magnético cuando los portadores se excitan a amplitudes grandes de resonancia y
luego se dispersan por acción de las impurezas o por las vibraciones de red. Con-
viene observar que en este experimento se desea que la cantidad w 0 T sea mucho
mayor que la unidad, de manera que los portadores puedan excitarse a través de
varias órbitas completas antes de dispersarse. En estas condiciones son capaces de
absorber una gran cantidad de energía de las microondas y cuando se produce la
dispersión, transformarla en vibraciones de la red cristalina. Por lo general, el expe-
rimento se lleva a cabo a una temperatura baja para obtener un valor grande de T, y
con un campo estático B 0 tan grande como sea posible para satisfacer el requisito
de que w 0 sea una frecuencia de microonda experimentalmente accesible. Por otro
lado, en el caso de las mediciones del efecto de Hall, el objetivo a menudo es lograr
que w 0 T sea mucho menor que la unidad para simplificar la interpretación de los
datos.
Cuando el efecto de resonancia de ciclotrón en el silicio y el germanio se
estudió de una manera experimental, se descubrió que para ambas substancias existen
Resonancia de ciclotrón y superficies elipsoidales de energía 319

más de dos resonancias (una para los electrones y otra para los huecos), como lo
predijo la teoría sencilla que se estudió anteriormente. 5 •6 Más aún, se observó que
algunas de las frecuencias resonantes del ciclotrón sufrían cambios notables cuando
se alteraba la orientación del cristal con respecto al campo magnético estático, en
tanto que otras eran prácticamente independientes de la orientación de la muestra.
Estos efectos se explicaron finalmente utilizando un modelo en el que las superficies
de energía constante de los electrones, dentro del espacio k, eran elipsoidales más
que esféricas, y en donde se consideró la presencia de tres bandas de valencia
independientes, dos de las cuales se degeneraban a k = O. Las superficies de energía
constante para huecos de estas bandas de valencia son más o menos esféricas, aun-
que, puesto que a2 e/ak 2 difiere para distintas bandas de valencia, existe más de una
masa efectiva posible para los huecos. Las diferentes características de este modelo se
han comprobado no sólo mediante la concordancia que tiene con los datos experimen-
tales que se han obtenido, sino también por medio de cálculos de mecánica cuántica
de la estructura de bandas de energía que se inician más o menos a partir de los
principios. 7 • 8 • 9
En primer lugar se estudiará la cuestión de las superficies elipsoidales de ener-
gía y se investigará la forma en que los resultados del experimento de resonancia de
ciclotrón se modifican cuando las superficies de energía tienen esta forma. Hasta
ahora se ha supuesto siempre que el punto de energía mínima en la zona reducida
de Brillouin ocurre a k= O, en el centro de la zona, como se ilustra en la figu-
ra 8.6. En este caso, un electrón que se encuentra cerca de la energía mínima
presenta el comportamiento dinámico de un electrón libre, conduciendo a una super-
ficie de energía constante que, dentro de esta región del espacio k, es más o menos
esférica, como se ilustra en la figura 8.ll(a).
Sin embargo, se encontró que el valor mínimo de energía dentro de la zona
reducida necesariamente no debía encontrarse en k= O, sino que podía localizarse en
cualquier otro punto dentro de la zona. En efecto, esta es la situación que se
observó en el caso de los electrones dentro de la banda de conducción del germanio
y el silicio. Puesto que la red de diamante, en realidad es dos redes cúbicas cen-
tradas en la cara que tienen una interpenetración y que están separadas a lo largo de
la diagonal del cubo por una distancia a ..j3/4 (en donde a es el lado del cubo), la
célula unitaria primitiva para esta red es la misma que la que se muestra en la
figura 1.5, excepto que existe un segundo átomo dentro de la célula. La red recí-
proca, por ende es la misma de la estructura cúbica centrada en la cara y, por
tanto, la zona de Brillouin tiene la misma forma que la zona cúbica centrada en el
cuerpo que aparece en la figura 8.14(c). En la figura 9.15(a) se ilustra una gráfica
de e en función de k en la dirección (1 00) en esta zona de Brillouin para los
electrones de la banda de conducción del silicio. El valor más pequeño de e se
alcanza a un valor de k que es aproximadamente 0.8(27T/a). Este es el valor mínimo
absoluto de e dentro de la zona de Brillouin. se pueden tener otras curvas de e en
función de k para otras direcciones, que presenten otros valores mínimos de e; pero
ninguno será tan bajo como el valor ee de la figura. Para energías mayores que ee,
se pueden construir superficies de energía constante alrededor del punto de energía
mínima. Es obvio que la curva de energía en función de la cantidad de movimiento
del cristal de la figura 9.15(a) es aproximadamente parabólica alrededor del punto
mínimo, correspondiendo al comportamiento del electrón libre con una masa efectiva

5 G. Dresselhaus, A. F. Kip y C. Kittel, Phys. Rev. 92, 827 (1953).


6 R. N. Dexter, H. J. Zeiger y B. Lax,Phys. Rev. 104, 637 (1956).
7 F. Herman, Phys. Rev., 93, 1214 (1954); Proc. lnst. Radio Engrs. 43, 1703 (1955).
8 D. P. Jenkins, Physica, 20, 967 (1954).
9 E. M. Conwell, Proc. Inst. Radio Engrs., 46, 1281 (1958).
320 Semiconductores electrónicos uniformes en equilibrio

••

-;0=-t---------;,---+- *· -;o::;t-----------+-k{111)

(a) Silicio
*·· (b) Germanio
Zona
de frontera

Figwa 9.15. La relación de € en función de k para (a) la banda de conducción del silicio
graficada a lo largo de la dirección k, (b) la banda de conducción del germanio
graficada en la dirección (111) dentro del espacio k.

apropiada que se denominará mjj. Si se graficara la curva de e en función de k a lo


largo de una dirección que pase por el punto mínimo, pero perpendicular al eje kx
(por ejemplo, una línea paralela al eje ky). también se podría obtener una curva que
sería parabólica alrededor del punto mínimo; pero en este caso no se obtiene el
aspecto de simetría del cristal que requeriría que la curvatura en esta dirección
fuera la misma que se tiene a lo largo de la dirección kx. (Esta situación se ilustra
en -la figura 9.16.) Como resultado, la masa efectiva relacionada con los cambios en
la componente de h cantidad de movimiento en esta dirección tiene un valor que
difiere del que se dio con anterioridad y que se designará como mi.
Como se verá
en breve, esto hace que los requisitos de la simetría del cristal establezcan que la
masa efectiva tenga el mismo valor mi
para cualquier dirección dentro del espacio k,
normal a la dirección kx en este ejemplo.
La energía que sobrepasa el valor de Ec representa la energía cinética de un
electrón libre dentro de la banda de conducción, de donde,

(9.9-15)

c{k)

- Graficada hacia la dirección *•


- - Graficada hacia la dirección k, o kz
1 1
-4---------------r-----1--k

Figura 9.16. La relación de E en función de k para la b.anda de conducción del silicio graficada
en la dirección k" (curva continua) y a lo largo de una línea normal al eje kx
que pasa por el punto kmín (curva punteada). Las diferentes curvaturas en el
punto mínimo reflejan la anisotropía de la masa efectiva.
Resonancia de ciclotrón y superficies elipsoidales de energía 321

en donde Pxo = hkxo representa el valor de Px en la base de la banda, como se


ilustra en la figura 9.15(a). De acuerdo con esto, la superficie de energía constante
de un electrón cuya energía e es ligeramente mayor que Ec, es un elipsoide de
revolución cuyo centro se localiza en kx = kxo, ky = kz =O. No obstante, puesto
que las seis direcciones (100) de una red cúbica son cristalográficamente equivalen-
tes, la curva de e en función de k en cualquiera de estas seis direcciones debe ser la
misma. Entonces, deben tenerse seis mínimos de energía equivalentes a lo largo de
las seis direcciones (1 OQ)· y con cada uno de estos mínimos debe asociarse una
familia de superficies elipsoidales de energía constante similares a las que se descri-
ben en (9.9-15). En la figura 9.17(a) se da una representación de esta situación.
Esto pone en claro por qué los elipsoides deben ser de revolución; como se vio en
el capítulo anterior, la superficies de energías constantes deben tener todas las pro-
piedades de simetría de la zona de Brillouin que, a su vez, conserva todas las
propiedades de simetría de un cristal cúbico. Si los elipsoides no son de revolución,
la familia de superficies de energía constante ya no sería invariable en todas las
operaciones para las que un cristal cúbico permanece invariable.

(a) Silicio (b) G~rmanio

Figura 9.17. Superficies elipsoidales de energía constante dentro del espacio k para (a) el silicio
y (b) el germanio. En el primero, los ejes principales de la elipsoide siguen las
direcciones {100} mientras que en el segundo, puesto que el mínimo de energía
se localiza en la frontera de zona, las superficies de energía constante forman
ocho medias elipsoides cuyos ejes principales quedan sobre las direcciones {111}.

La situación para los electrones de la banda de conducción del germanio es


algo similar, excepto que se tiene un conjunto de ocho puntos equivalentes de
energía mínima que quedan en las direcciones (111) dentro del espacio k en la
intersección de tales direcciones con la superficie de la zona de Brillouin. Por tanto,
estos mínimos quedan en centros de las caras hexagonales de la zona de Brillouin.
Las superficies de energía constante tienen nuevamente la forma elipsoidal; pero,
puesto que los mínimos de energía están en la frontera de la zona y, dado que
existe una región de energía prohibida bastante amplia que debe vencerse antes de
que los electrones puedan excitarse para salir de la zona de Brillouin en estas
direcciones, existen ocho mitades de elipsoides que se extiende hacia el interior de la
zona de Brillouin en las direcciones ( 111), como se muestra en la figura 9 .l 7(b ).
Esto puede considerarse, para muchos fines, como equivalentes a cuatro elipsoides
completos. En ambos casos se tiene un tensor de masa efectiva asociado con cada
322 Semiconductores electrónicos uniformes en equilibrio

elipsoide cuyos elementos describe la expresión (8.8-7). Al calcular las propiedades


de transporte y otras características físicas de los cristales en los que las superficies
de energía son elipsoidales, por lo general se determina el efecto debido a una
elipsoide (que es casi siempre anisotrópico) y luego se suma sobre todas las elipsoi-
des. Se ha encontrado que las propiedades de transporte en cristales cúbicos son
isotrópicas después de efectuar la suma, a pesar del hecho de que las anisotropías se
asocian con elipsoidales individuales. Tanto en el germanio, como en el silicio, el
efecto lortgitudinal de la masa mW
es mucho mayor que la masa transversal m!,
de
donde, los elipsoides son muy largos y delgados. Los valores reales, tal como se
determinan mediante los experimentos de resonancia de ciclotrón, 5 son los que apa-
recen en la tabla 9.2.

TABLA 9.2.
Masas efectivas de electrones en el germanio
y el silicio

"relación de
masas"
m! mW/m!
Germanio 1.64 mo 0.0819 mo 20.0
Silicio 0.98 mo 0.19 mo 5.2

A continuación se investigará el efecto de resonancia de ciclotrón en materiales


en los que las superficies de energía son elipsoidales. Para principiar, se calculará la
frecuencia de resonancia asociada con un solo elipsoide que se supondrá simétrico
alrededor del eje kz y que está centrado en el punto kzo, como se indica en la
figura 9.18. La inducción magnética B0 forma un ángulo 8 con el eje principaf del
elipsoide y, para mayor facilidad, se supondrá que el vector del campo eléctrico
oscilante tiene sólo una componente y. La selección de este sistema de coordenadas
se hace sólo con el fin de realizar estos cálculos y, cuando concluyan, se verá que la
única coordenada de importancia física es el ángulo () entre el campo y el eje
longitudinal del elipsoide.
En estas circunstancias, la ecuación de movimiento (para una partícula de carga
positiva e) se puede escribir en función del tensor (8.8-6) que representa la recíproca
de la masa efectiva como

-dv = ( - 1 ) · F = ( - 1 ) • (eE +-e v X B). (9.9-16)


dt m* m* e

La relación entre e y k para el caso de la superficie de energía elipsoidal que


se mu-:,tra en la figura 9.18, debe ser, de acuerdo con (9.9-15),

_ _ ,. 2 [k~ +k~ (k.- k. 0) 2 ]


¡¡ ¡¡e-"
2m.L
* + *
2m 11
• (9.9-17)

Las componentes del tensor (1/m*)«fl se pueden encontrar ahora de acuerdo


con (8.8-7). En este caso, a2 ejakaakfJ =O para oc"" {J, de tal manera que todos los
Resonancia de ciclotrón y superficies elipsoidales de energía 323

Figura 9.18. Geometría vectorial usada en el cálculo de la sección 9.9.

elementos del tensor que quedan fuera de la diagonal son cero. Los elementos de la
diagonal se calculan fácilmente y el resultado es

(1/m*)xx = (1/m*)yy = 1/m! y (1/m*)u = 1/mjj · (9.9-18)

De donde, el tensor de la masa efectiva tiene la forma

1
o o
mi

(~.) = o m1
o (9.9-19)

1
o o ---¡
mil

1
o o Fx Fxfm!
m1

(~.). F = o
1
o . F, F,/m! (9.9-20)
m!
1
o o Fz Fzfmii .
m•u
Si se insertan las componentes de la fuerza de Lorentz para Fx, Fy y Fz, y se
igualan a lar. componentes de dvfdt, como lo requiere (9.9-16), la ecuación rlel
324 Semiconductores electrónicos uniformes en equilibrio

movimiento se puede escribir como sigue

(9.9-21)

Si se observa que Bx =bo sen8,Bz =Bo cosO, By= O,Ey =E0 eiwt,Ex =Ez= O.
estas ecuaciones se pueden expresar como

(9.9-22)

dv.fdt =- w 11 vY sen(}

en donde

eB 0
y W¡¡ = -.-.
m c
(9.9-23)
11

Al igual que antes, se pueden suponer soluciones oscilatorias de la forma


x(t) = x 0 eiwt, y(t) = y 0 eiwt, y z(t) = z 0 eiw t, substituyendo éstas en las ecuaciones de
movimiento (9.9-22) y resolviendo para las amplitudes,

(9.9-24)

eE 0 iw 11 sen (}
Zo = - mi w(w 2 - wf cos 2 ( } - wJ.wll sen 2 8) ·
Estas amplitudes se hacen muy grandes cuando

(9.9-25)

y este> ·.oncuerda con la frecuencia de resonancia de ciclotrón para el elipsoide


partirnldf que se está estudiando. La frecuencia de resonancia depende sólo del
ca•¡,po magnético, las masas efectivas y el ángulo (} comprendido entre el campo 8 0
:. el eje principal de la elipsoide. Para superficies de energía elipsoidales, es evidente
que la frecuencia de resonancia es una función fuerte de la orientación de la mues·
tra con el campo magnético. Se puede demostrar que, a la frecuencia de resonancia.
Resonancia de ciclotrón y superficies elipsoidales de energía 325

las órbitas de la partícula son elípticas, de acuerdo con (9.9-24) y que quedan en
un plano perpendicular al campo B0 . Los resultados anteriores se derivaron para
partículas positivas con carga e; pero para el caso de los electrones sólo se necesita
substituir e con -e (en cuyo caso también se debe hacer la substitución de wll por
- w 11 y w 1 por - w 1). Evi den temen te, la frecuencia de resonancia no la alteran
estas substituciones; la única diferencia es que los electrones atraviesan sus órbitas en
el sentido opuesto del que se encontró para las partículas positivas.
En el caso del silicio, si el campo B0 se orienta en la dirección z, entonces
(} = O para las dos elipsoides cuyos ejes principales se encuentran a lo largo de la
dirección kz y (} = 90° para los otros cuatro elipsoides. Entonces, de acuerdo con
(9.9-29), habrá dos picos de resonancia superpuestos en w = w1 de los dos primeros
elipsoides y cuatro resonancias superpuestas a w = ..jw1w 11 de los otros cuatro. Su-
poniendo que el número de electrones pertenecientes a cada elipsoide es igual, lo
cual es cierto en la condición de equilibrio, la segunda resonancia que cubre cuatro
elipsoides debe tener el doble de la fuerza de absorción de la primera, que sólo
cuenta con dos. Si el campo B0 tiene otra orientación, se pueden encontrar hasta
tres tipos de resonancia correspondientes a los tres ángulos posibles entre B0 y los
ejes de la elipsoide. Esta teoría de la resonancia de ciclotrón con las superficies de
energía elipsoidales sirven para explicar todas las resonancias observadas experimental-
mente, que se ven muy afectadas por la orientación de la muestra, y permite deter-
minar m l y m~ basándose en frecuencias de resonancia de ciclotrón determinadas de
un modo experimental, y así se pudo proponer un modelo correcto para la orien-
tación de las elipsoides.
Los datos de resonancia de ciclotrón para huecos en las bandas de valencia del
silicio y el germanio no presentan las características típicas del efecto con superficies
de energía elipsoidales. Aunque en ambos materiales existen numerosos picos de
resonancia para los huecos, los cambios característicos de la frecuencia de resonancia
con la orientación de la muestra que se observan en las superficies elipsoidales de
energía, están ausentes o son mucho menos pronunciados. El modelo de la banda de
valencia que parece ajustarse mejor a estos (y otros) datos, es el de dos bandas
separadas que se degeneran en el máximo de energía en k = O; pero que tienen
diferentes masas efectivas. Existe también una tercera banda "de separación" con
una energía máxima (en k = O) un poco inferior a la parte superior de la banda de
valencia. En la figura 9.19 se ilustra esta situación. Están presentes simultáneamente

Figura 9.19. Las tres distintas ramas de las bandas de valencia del silicio y el gennanio.
326 Semiconductores electrónicos uniformes en equilibrio

huecos ligeros y pesados (pertenecientes a las bandas l y h de la figura), y se puede


observar un efecto de resonancia de ciclotrón diferente para cada tipo. Puesto que
las l..Jperficies de energía asociadas con estas bandas son más o menos esféricas, la
dependencia de la orientación que tiene el efecto de resonancia de ciclotrón es
mucho menos pronunciada que la que se asocia con las superficies elipsoidales de la
banda de conducción. No obstante, las superficies de energía son aproximadamente
esféricas; están algo distorsionadas de la forma realmente esférica, incluso para va-
lores pequeños de k. Esta "desviación" debe tomarse en cuenta para explicar todos
los detalles de los datos de resonancia de ciclotrón, sobre todo en el caso de la banda
de huecos pesados en donde la desviación de la esfericidad es más pronunciada.
La diferencia de energía entre el punto máximo de la banda "de separación" de
posición más baja y el máximo de la banda de valencia (ev- €8 en la figura 9.19).
es aproximadamente 0.28 eV en el germanio y 0.035 eV en el silicio. En el caso del
germanio, esta diferencia de energía es lo suficientemente grande para que en con-
diciones ordinarias, se desprecie la población de los huecos de la banda más baja.
Sin embargo, en el caso del silicio, excepto a temperaturas bajas, se encontrará un
número importante de huecos en esta banda. La separaclón de las bandas se debe a
la interacción de los espines electrónicos de los electrones de valencia con el mo-
mento magnético producido por su movimiento orbital. Si no fuera por este acoplil-
miento esptn-órbita la diferencia de energía €v - e8 sería cero y las tres band~
coincidirían en el punto k= O. Las masas efectivas asociadas con las tres variedade
de huecos se dan en la tabla 9.3.

TABLA 9.3.
Masas efectivas de huecos en el germanio
y el silicio

Germanio 0.044mo 0.28 mo 0.077 mo


Silicio 0.16 mo 0.49 mo 0.245 mo

La existencia de un hueco como una especie particular, en general, está limi·


tada a un solo tiempo libre medio. Por ejemplo, un hueco se puede dispersar fácil-
mente de la banda l a la banda h, o viceversa, mediante cualquiera de los procesos
de dispersión con los que normalmente se asocia. Por esta razón no es posible
detectar la existencia de las variedades independientes de huecos en cualquier medi·
ción (por ejemplo, la conductividad o· el arrastre de portadores) que implica sólo el
comportamiento promedio del portador promediado sobre un gran intervalo durante
el que las identidades de los huecos dentro de las tres bandas pueden intercambiarse
con frecuencia. En el experimento de la resonancia de ciclotrón, en donde se mide
una resonancia que se excita en un tiempo corto en comparación con el tiempo
libre medio (w 0 r ;:¡¡:. 1), se puede manifestar fácilmente la presencia de algunas varie·
dades de huecos. Se puede hacer la misma observación en relación con los electrones
en los diferentes mínimos equivalentes de energía de la banda de conducción; los
procesos normales de dispersión pueden transferir electrones sin más problemas, de
una elipsoide a otra (dispersión entre valles), de tal manera que en un tiempo largo
en comparación con el de relajación, se pierde irrecuperablemente la identidad de un
electrón que indica a qué elipsoide en particular pertenece.
Densidad de estados, conductividad y efecto de Hall 327

9.10 DENSIDAD DE ESTADOS, CONDUCTIVIDAD Y EFECTO


DE HALL CON SUPERFICIES COMPLEJAS DE ENERGIA

En una situación en donde existen dos bandas parabólicas que se degeneran en


k = O, con superficies de energía esféricas que dan origen a dos especies diferentes
de portadores, las poblaciones relativas de las dos especies y los factores de densidad
de estados se pueden calcular con facilidad. Se analizará el caso de una banda de
valencia de esta naturaleza en la que se encuentran presentes simultáneamente huecos
ligeros (con una masa efectiva mt) Y huecos pesados (con una masa efectiva m~).
En estas circunstancias, el total de concentración de huecos p 0 se puede escribir
como la suma de la concentración de huecos ligeros p1 y la de huecos pesados Ph•
de donde, de acuerdo con (9.3-15) y (9.3-16),

(9.10-1)

en donde Uv 1 y Uvh son factores de la forma (9.3-16) para huecos ligeros y pesa-
dos. Esto se puede escribir en la forma

- (2nm;.kT)3/2
Po- 2 h2 e
-c•,-•.>fkT
' (9.10-2)

como si se tratara de una sola especie de portadores, si se define la masa efectiva


equivalente de la densidad de estados m~ 9 , como

(9.10-3)

Esta es una aproximación de la situación real en la banda de valencia del


germanio y el silicio, aunque es sólo aproximada, ya que el efecto de la banda "de
separación" se hace a un lado por completo y dado que las superficies reales de
energía no son perfectamente esféricas en modo alguno. La conductividad procede
directamente de (9.10-2) utilizando (4.7-8).
Para un grupo de superficies elipsoidales de energía tales como las que se
vieron en relación con la banda de conducción del germanio o el silicio, se puede
calcular el factor de densidad de estados g(e) mediante una extensión del procedi-
miento desarrollado en la sección 5.2. La ecuación (9.9-17) para una de las elipsoi-
des se puede reducir mediante la transformación

(9.10-4)

a la de una esfera dentro del espacio p'.


p~2 + p'2 + p'2 p'2
8 - Be= >' z (9.10-5)
2m 0 = 2m 0 •
328 Semiconductores electrónicos uniformes en equilibrio

El volumen del espacio p' de la capa esférica limitada por los radios p' y
p' + dp' para una sola elipsoide, ahora se puede calcular del mismo modo que se
hizo en la sección 5.2 para las superficies esféricas de energía; pero puesto que se
tiene más de una superficie elipsoidal de energía constante, el volumen total del
espacio p' correspondiente a las energías dentro del rango e a e+ de, se obtiene
multiplicando el volumen encontrado para una sola superficie por el número de
elipsoides equivalentes. Si este número es v, el volumen correspondiente dVp, dentro
del espacio rJ es

(9.10-6)

Sin embargo, de acuerdo con (9.10-4), los elementos de volumen dV =


dpxdPydPz y dVP' = dPx•dPy•dPz' están relacionados por medio de

m~/2
dVp' = ( m.~.*2 m*)1/2 dVP, (9.10-7)
11

por lo cual, el volumen dVP del espacio p dentro del rango de energía e a e+ de.
se convierte en

dVP-- 4V¿.
'2nv(m*.l. 2 m*)
11 112 Je - ee de • (9.10-8)

Al dividir esto entre el volumen h 3 /2 asignado a un solo estado cuántico, se


obtiene el número de estados cuánticos dentro de este rango de energías que, por
definición, es g(e)de, de donde,

8 ¡;;2 ( *2 *)1/2
( )de -_ ...; ...nv hm.~. m 11
g e
J--
e - ee de.
3 (9.10-9)

Si de nuevo se define una masa efectiva equivalente de densidad de estados


m~ 9 , como

*3/2 _ (m*2m*)1/2
m ds (9.10-10)
- .l. 11 '

la ecuac10n (9.10-9) se puede escribir (excepción hecha del factor v) en la misma


forma (5.2-22) como la expresión acostumbrada de la densidad de estados para el
caso en que las superficies de energía son esféricas. Aplicando directamente los
procedimientos por los que se obtuvieron (9.3-6) y (9.3-7), es claro que se debe
obtener

(9.10-11)

siendo r,¡Js como lo indica (9.10-10).


Al calcular la conductividad de un semiconductor en el que las superficies de
energía constante son elipsoidales, primero es necesario determinar la contribución de
eurriente o conductividad para una sola elipsoide y luego sumar sobre todas las
elipsoides para determinar la conductividad total. Puesto que la masa efectiva aso-
ciada con cada elipsoide individual es una cantidad tensorial, también lo será la con-
ductividad. En general, las ecuaciones relacionadas con la densidad de corriente y el
Densidad de estados, conductividad y efecto de Hall 329

campo eléctrico se pueden escribir como relaciones tensoriales de la forma

(9.10-12)

E= p· 1 (9.10-13)

en donde a es el tensor de conductividad y p es un tensor de resistividad. Eviden-


y
temente, pÜesto que de acuerdo con (9.10-12) (9.10-13),

e · 1 = e · ~ · E = E, (9.10-14)

se de be tener

(9.10-15)

en donde ! es el tensor unitario cuyos elementos son {Ja. 8 . En consecuencia, el


tensor de resistividad es la inversa del tensor de conductividad, es decir,

(9.10-16)

Los elementos del tensor de cvnductividad a<il relacionados con la iésima


elipsoide de energía se pueden escribir, en analogía con (7 .3-15), como

(9.10-17)

en donde rl(i) es la densidad de portadores de carga asociados con dicha elipsoide.


Por tanto, la conductividad total se puede expresar como

(9.10-18)

y la suma se hace sobre todas las elipsoides. Si se usa (8.8-7) para expresar las
componentes tensoriales (9.1 0-17) se puede escribir como sigue

a2¡p> a2e(i) a2e(i)


ak X2 okx oky okx okz
. n< 0e 2i ¡J2¡;(i) o 2e(i) a2e(i)
a<•>= - - (9.10-19)
1i2 oky okx o~k2y aky ak% '
a2e(i) a2¡;<i> o 2e(i)
ok% okx okz oky ok z2

en donde ¡;(i)(k) es la energía expresada en función de k para la iésima elipsoide.


En el caso del silicio, los principales ejes de las elipsoides yacen a lo largo de
los ejes de coordenadas del espacio k; para las dos elipsoides cuyos ejes principales
quedan sobre el eje kz, en las direcciones [001] y [001], la función ¡;(OOI)(k) está
dada por (9.9-17), lo cual conduce a las componentes de tensor (9.9-18) para el tensor
330 Semiconductores electrónicos uniformes en equilibrio

de conductividad para estas elipsoides se convierte, entonces, en

1
o o
m!
= a<oon = n<001>e2i o 1
a<OOl) o (9.10-20)
m!
o o m¡¡1
*
Las ecuaciones de las otras elipsoides se pueden escribir y los componentes de
tensor se obtienen de la misma manera. Para las dos elipsoides cuyos ejes principale1
se orientan a lo largo del eje kx,

1
o o
*m u 1
CJ(lOO) = CJ(TOO) = n(lOO)e2i o o (9.10-21)
m*J.
1
o o m*J.

en tanto que, para los dos elipsoides cuyos ejes principales siguen la dirección de:
eje ky,

1
o o
m!
= CJfOTO) = n(010)e2i o 1
CJ(OlO) o (9.10-22)
*m u 1
o o
m!
Dado que las seis elipsoides tienen mínimos de energía equivalente n(loo) =
n<1oo) = n<tot) = n<ofo) = n< 001 ) = n<oo1) = n 0 /6. Cuando se efectúa la suma in-
dicada en (9.3-14) y se aplica este hecho, se obtiene

1( 2 1)
3 m!+ m 0 o o
o 1( 2 1)
3 m!+ m 0 o
o o 1( 2 1)
3 m!+ m0

1 ( --¡
= n 0 e 2 i -3 2
m1.
+*
m
1
11
)t_ (9.10-23)

para la conductividad total. Puesto que CJ es un múltiplo escalar del tensor unitario
!_, la conductividad total es isotrópica (a -pesar de que la conductividad asociada con
Densidad de estados, conductividad y efecto de Hall 331

una sola elipsoide no lo sea). La magnitud escalar de la conductividad se puede


representar como

(9.10-24)

en donde m~ es una masa efectiva de conductividad defmida por

l. 1( 2 1) (9.10-25)
m: = 3 m! + m¡j ·

Se puede demostrar que se obtendría exactamente el mismo resultado para


cualquier conjunto de superficies elipsoidales de energía de que se trate, siempre y
cuando la configuración sea invariable en todas las operaciones de simetría en las
que el cristal cúbico sea inalterable. De hecho, se puede demostrar que la conducti-
vidad de todos los cristales cúbicos debe ser isotrópica sea cual fuere la forma
específica que puedan tomar las superficies de energía constante. En particular, las
ecuaciones (9.10-23) a (9.10-25), también son válidas para los electrones de conduc-
ción en el germanio, en donde las elipsoides de energía constante están orientados a
lo largo de las direcciones (111). Es muy ilustrativo desarrollar el tensor de conducti-
vidad para el germanio, y este problema queda asignado como ejercicio para el
lector.
El tensor de resistividad e
es una matriz de componentes inversa a la matriz
de conductividad. Lo elementos de la matriz que es la inversa de la ~ cuyos
elementos son a,.11 están dados por la fórmula

_ 1 cof(a 11,.)
a,.p = á(a) ' (9.10-26)

en donde cof (a11,.) es el cofactor 10 del elemento a11,. y A(a) es el determinante de


los coeficientes de ~· En consecuencia, es evidente que los elementos de e_ son

anayz - a:x:yarr
a""a•• - a;. (9.10-27)

en donde

(9.10-28)

Se ve claramente que si a tiene la forma (9.10-23), el tensor de resistividad


es isotrópico y se puede represeñtar mediante una cantidad escalar cuya magnitud es,
sencillamente, el recíproco de la conductividad (9.10-24).
A continuación se ilustrará la computación del efecto de Hall en un material
con superficies elipsoidales de energía, considerando en detalle el efecto de Hall en

lO Véase, por ejemplo, L. A. Pipes, Applied Mathematics for Engineers and Physicists. Nue-
va York. McGraw-Hill (1946), página 71.
332 Semiconductores electrónicos uniformes en equilibrio

un material en el que los ejes principales de las elipsoides se extienden a lo largo de


los ejes kx, k y y kz (como por ejemplo, en el silicio), en el caso espec:al en el que
el campo magnético está orientado en la dirección z y la corriente fluye en la
dirección x. También se supondrá que existe sólo una especie de portadores. En
estas condiciones, los tensores inversos de la mas.a efectiva para diferentes elipsoides
tienen la forma que se señala en las ecuaciones (9.10-20, 21 y 22) y, en particular.
la ecuación tensorial de movimiento para portadores con carga e en los elipsoides
(100) y (TOO), se pueden escribir, en analogía con (9.8-4), como
1 e
o o eEx +-e (v,B. - v.B,) dvxfdt
mn*
1 e
(~.).! = o mi o eE7 + - (v.Bx- vxB.)
e
dv7 /dt (9.10-29)

1 e
o o eE. +-e (vxBy- v1 Bx) dv.fdt
mi
Si se hacen las multiplicaciones de matriz indicadas, se escriben las ecuaciones
de las componentes del movimiento y se observa que Bx =By =O, en tanto que
Bz = 8 0 se obtiene
dvx eEx
-=-+w 11 v7
dt mjj
dv, eE,
dt = mi- WJ.Vx
dv. eE.
(9.10-30)
dt= mi'
en donde wll y w 1 son como se indica en {9.9-23). _ _
Si la primera de estas ecuaciones se multiplica por yw1 y se suma a iywll por
la segunda, la ecuación resultante se puede expresar en la forma

. ~ iJW"; E,)
dZ
-d + !y ro 11 roJ.Z =e (JroJ.
-.-Ex+--.- (9.10-31)
t m 11 mJ..
en donde Z es la cantidad compleja

z = vxJwJ. + iv,Jwn. (9.10-32)

Evidentemente, la ecuación (9.10-31) tiene exactamente la misma forma que


(9.8-8). Todos los pasos comprendidos en la solución de esta ecuación y el promedio
sobre las trayectorias y la distribución de velocidad que conducen a las ecuaciones
(9.8-16) y (9.8-17), se pueden repetir ahora principiando con (9.10-31). La justifica-
ción física de cada etapa es la misma que ya se dio. De esta manera, se puede
demostrar que
1 -
ii~too) = ii~Too> = ~ Re(Z)
yC.OJ.

(9.10-33)
Densidad de estados, conductividad y efecto de Hall 333

mientras que
T
¡;~too> = ¡;~ oo> = -1= lm(Z)
-
Jwu
(9.10-34)

Si estos resultados se restringen al coeficiente de Hall de campo pequeño, se


puede suponer wnwlr 2 ~ 1 y dejar sin efecto los términos wnwlr 2 de los denomi-
nadores de las ecuaciones (9.10-33) y (9.10-34). Ahora se pueden obtener las den-
sidades de corriente a partir de las velocidades, al igual que antes, de donde, para la
iésima elipsoide,

y ¡<i) = p<i>ev<i> (9.10-35)


y o y '

mientras que, sumando todas las elipsoides, las componentes del total de densidad de
corriente son
1X = "L.- p(i>ev<i>
o X y J~i) =¿ pg>ev~i)· (9.10-36)
i i

En el estado estacionario no puede haber una corriente en la dirección y, de


modo que, de acuerdo con (9.10-36), se debe tener

(9.10-37)

Como se dijo antes, las concentraciones p~> para las ~eis elipsoides son las
misma e iguales a p 0 /6. La expresió~ para vvoo) y ii~ 100 ) se dio antes en
(9.10-34). Para las elipsoides (010) y (010), se puede establecer fácilmente, usando
el tensor de masa apropiado en (9.10-29), que las ecuaciones de movimiento para las
componentes x y y de la velocidad son las mismas que las que se dan en (9.10-30),
excepto que ~e intercambian mjj y m! y wu y w1 . Entonces, la expresión para
¡¡~o1o) y ¡;~0 1 0) es (9.10-34) intercambiando estas cantidades. En el caso de las
elipsoides (001) y (OOI), es obvio, siguiendo el mismo razonamiento, que las ecua-
ciones de movimiento de las componentes x y y de la velocidad son las mismas que
las de (9.1 0-30), excepto que mjj y w 11 no aparecen en absoluto y que, en todo_§ los
casos, se substituyen por mi y w 1 . De donde, la expresión de ¡;}0° 1 ) y P}001 ) se
obtiene a partir de (9.10-34), substituyendo mjj y wu por mi y w1. Después de
hacer todas estas substituciones, efectuar la suma indicada en (9.10-37) y resolver
para Ey en función de Ex. se obtiene

_ eB 0 2
(' ) 2mt f m1 (9.10-38)
E,- 7 i •2 "'( 2 1 ) Ex.
m1. m 11 ---¡ +---¡
m1. m 11

Desechando los efectos de la magnetorresistencia, que no son importantes para


fuerzas reducidas de campo magnético, Ex se puede expresar en términos de lx de
acuerdo con (9.10-24) como sigue

Ex= lx/t1o = 31 x . (9.10-39)


( 2
Poe2 i---¡ 1)
+---¡
m1. m 11
334 Semiconductores electrónicos uniformes en equilibrio

Al substituir esto en (9.10-38), se puede escribir finalmente

(9.10-40)

siendo

_ _1_ -r 2 3(2m! + mjj)


R- 2 2·
(9.10-41)
p0 ec (i) *2 • ( 2 1)
m.~. m -;¡;+-
11
m.~. ut

Esto se escribe a menudo de una manera. algo diferente; si K se defme como


la relación de la masa longitudinal a la transversal, según lo cual,

(9.10-42)

entonces, (9.10-41) se puede expresar como

1 T 2 3K(K + 2)
R = -p0-ec -(i-)2 ~(2:-K.:......._+-:-1)=2 • (9.10-43)

Aunque se supusieron direcciones particularmente simples para la corriente de


la muestra y el campo magnético, si se hubiera procurado obtener el resultado para
una dirección arbitraria de flujo de corriente u orientación de campo, se habría
descubierto que el coeficiente de Hall de campo pequeño {9.10-41) ó (9.10-42) es
independiente de la orientación de la corriente y la dirección de campo con respecto
a las elipsoides de energía. Por tanto, se puede demostrar que el coeficiente de Hall
de campo pequeño es isotrópico, aunque esto no es correcto si el campo magnético
es tan grande que w uw 1T 2 ya no sea pequeño en comparación con la unidad. Los
resultados anteriores se obtuvieron también para un conjunto particularmente sencillo de
elipsoides de energía; pero se puede demostrar que se aplican a cualquier grupo de super·
ficies elipsoidales de energía, siempre que dicho grupo tenga una simetría cúbica. Por
supuesto, estos resultados se desarrollaron para portadores con una carga +e. Para
semiconductores tipo n (y Si y Ge tipo n son los ejemplos más comunes de substan-
cias con superficies elipsoidales de energía), se debe substituir e por medio de -e y
p 0 con n 0 en (9.10-41) y (9.10-43). Si la ecuación (9.10-43) se multiplica por a0
y si la cantidad Ra0 se defme, al igual que antes, como la "movilidad de Hall"
Jl.H, es obvio que la relación de la movilidad de Hall a la movilidad de arrastre real
J1. está dada por

JlH T2 3K(K + 2)
¡; = (t)2 (2K + 1)2 (9.10-44)

para un semiconductor con superficies de energía constante elipsoidales.


El presentar una exposición completa de los efectos galvanométricos y la mag-
netorresistencia para semiconductores con superficies elipsoidales de energía es algo
que están más allá del alcance de esta obra y, por ende, se omitirá. Sin embargo, se
debe hacer notar especialmente que la magnetorresistencia no es isotrópica en estas
condiciones y que las mediciones de ésta, en func\ón de la orientación de la muestra
y la dirección del campo magnético pueden constituir una fuente abundante de
datos experimentales con los que se puede comprobar en detalle cualquier modelo
propuesto de superficies de energía.
Mecanismos de dispersión y movilidad de los portadores de carga 335

9.11 MECANISMOS DE DISPERSION Y MOVILIDAD


DE LOS PORTADORES DE CARGA

En los semiconductores, al igual que en los metales, los procesos de dispersión


más importantes incluyen las interacciones de los electrones (o huecos) con las
vibraciones de red y con átomos de impureza. En cristales relativamente puros o a
temperaturas más o menos altas, la primera interacción es casi siempre predominante
en tanto que a temperaturas bajas o en especímenes impuros, la segunda parece ser
más importante. Existe un amplio rango de posiciones intermedias en las que ambos
procesos son significativos.
El efecto de cualquier interacción de dispersión, particular i, se puede evaluar
calculando el tiempo libre medio T ¡ asociado con este proceso. Entonces, el tiempo
libre T se puede expresar mediante

1 1
-=¿-
-r i 'r¡
(9.11-1)

como se indicó en la secc10n 7.5. Esto pone en claro que el proceso de dispersión
que conduce al tiempo libre más corto T¡, es el dominante. Una vez que se conoce
el tiempo libre medio T, la movilidad se puede expresar fácilmente como e1' /m*.
Desafortunadamente el cálculo del tiempo libre asociado con cualquiera de los
procesos de dispersión que tienen cierta importancia en los semiconductores, es muy
prolongado y elaborado, y los detalles matemáticos que comprende están por encima
del nivel que se ha fijado para este estudio. Por tanto, será necesario limitar este
análisis a un planteamiento cualitativo más o menos aproximado de la dispersión de
red, aunque se tratará de dar un método más o menos completo de la dispersión de impu-
rezas siguiendo el lineamiento que desarrollaron Conwell y Weisskopf. 11
A temperaturas bajas, es muy limitada la energía térmica disponible para ex-
citar vibraciones de red de modo óptico, y el proceso de dispersión de la red, más
importante, es la dispersión de portadores de carga mediante vibraciones de la red de
modo acústico. Sólo se tendrá en cuenta la dispersión de portadores mediante vibra-
ciones de tipo longitudinal; la razón por la que se desecha el efecto de los modos
transversales quedará demostrado en el curso de este estudio.
El paso de una vibración longitudinal a través de un cristal da origen a regio-
nes alternas de compresión y expansión de dicha red cristalina. Cuando el cristal se
comprime, las posiciones de las bandas de energía se alteran de tal manera que la
anchura de la banda prohibida se reduce (véase la figura 9.2); en la condición de
expansión, la anchura de la banda prohibida se incrementa . .&te efecto produce una
variación local en la energía asociada con el borde de la banda de conducción, como
se indica en la figura 9.20(a), que, para simplificar el cálculo, se puede substituir
con la variación escalonada que aparece en la figura 9.20(b) sin introducir un error
importante. Existe una variación similar en energía del borde de la banda de valen-
cia. Por tanto, se puede calcular la probabilidad de reflexión para un electrón inci-
dente sobre un solo "escalón" de la figura 9.20(b).
Para hacer esto, el electrón incidente sobre un escalón de esta naturaleza, con
una altura liec se representa mediante una función de onda de partícula libre con
una cantidad de movimiento positiva de la forma

(9.11-2)

11 E. Conwell y V. F. Weisskopf, Phys, Rev., 71, 388 (1950).


336 Semiconductores electrónicos uniformes en equilibrio

-----
<e
-x (a)
••
s.c
1
1
<c_jr---------,__________J~:-----~--------1
¡---
-T-
-x (b)
Ev-,L_________~---------¡________ _r--------,L . . , _

Figura 9.20. La variación sinusoidal de las energías de l¡¡ banda de conducción y la de valenca
en un cristal semiconductor, producida por fuerzas de compresión y t.xpansióc
asociadas con una vibración térmica longitudinal. (b) Una variación "de onch
cuadrada" que se aproxima a la ilustrada en (a) y que simplifica el cálculo de!
tiempo de relajación.

Como se ilustra en la figura 9.21, el electrón se puede "reflejar" o transmitir


en el escalón. De aquí que pueda haber una componente de la función de onda
asociada con una cantidad de movimiento negativa en la región (x < 0), represen-
tando al electrón reflejado que debe tener la forma

(9.11-3)
En la regwn que queda más allá de la barrera (x >O), la función de onda que
representa a un electrón transmitido sobre dicha barrera es

(9.11-4)
Todas éstas son funciones de onda de partícula libre que satisfacen la ecuación
de Schrodinger para un potencial constante. Puesto que la cantidad de movimiento liko
para la componente reflejada se supone idéntica a la cantidad de movimiento de la
partícula incidente, se supone que la interacción de colisión es perfectamente elás·
tica. Sin embargo, puesto que la onda de la red representada por la barrera de
energía, se desplaza con la velocidad del sonido, en realidad existe un efecto de
Doppler que hace que la cantidad de movimiento reflejada sea diferente de la inci-
dente. Dado que la velocidad del sonido es pequeña en comparación con la velo-
cidad térmica promedio de la partícula, el cambio de cantidad de movimiento es
sólo una fracción pequeña de la cantidad de movimiento de la partícula incidente y,
por ende, se puede omitir sin riesgo alguno en estos cálculos. De acuerdo con (4.9-8).
es obvio que si la energía de un electrón incidente es e0 y la de un electrón
"transmitido" es e 1 ,

y (9.11-5)

Transmitida= 'i3(xl-
lncidente =.¡,, (x) - - - 1 ¡ x-
Reflejad:< _=_.¡,2_(_x_l_
__- _ _ _ __, ___sj~ _
1
x=O

Figura 9.21. La "reflexión" de un electrón desde una barrera de potencial cuya altura es liec.
Mecanismos de dispersión y movilidad de los portadores de carga 337

de donde,

(9.11-6)

Puesto que la función de onda y su derivada deben ser continuas en x = O, se


puede escribir

(9.11-7)

1/lí(O) + 1/12(0) = 1/13(0).

Al substituir los valores dados en (9.11-2, 3 y 4) en estas ecuaciones, se puede


demostrar que

B k 0 - kt e 2k0
-=---
A k 0 + kt
y -=
A k0 + k 1 ·
(9.11-8)

Las probabilidades de transmisión y reflexión R y T están dadas por

(9.11-9)

(9.11-10)

Si la altura del escalón liec es pequeña, lo que se supondrá en este caso, de


acuerdo con (9.11-6) k 1 ===k0 , y (9.11-9) se puede expresar con la ayuda de esta
aproximación y (9.11-6), como

( m*&
R ~ 2¡2k¡ .
)2 (9.11-11)

La cantidad liec se puede relacionar con la deformación de compresión o


expansión li V/V0 a una primera aproximación mediante una relación lineal de la
forma

- «5V
- «5ec = .::.e • Vo ' (9.11-12)

en donde la constante del potencial de deformación Zc representa el cambio en el


borde de la banda de conducción por unidad de deformación de dilatación.
Puesto que las distorsiones cortantes asociadas con los modos de vibración
transversales no producen ningún cambio de primer orden en el volumen, estas
vibraciones no originan ningún cambio en Ec y su efecto de dispersión en los porta-
dores de carga es despreciable. El paso de una onda elástica longitudinal por el
cristal va acompañado, no obstante, de regiones coherentes de compresión y expan-
sión que son del orden de 1/2 en extensión lineal, en donde l es la longitud de
onda de la perturbación. Si un elemento de volumen V0 de esa extensión lineal se
338 Semiconductores electrónicos uniformes en equilibrio

somete a un esfuerzo de dilatación produciendo una presión maxnna {)p y un cam-


bio de volumen {j V, se ve claramente que la energía de deformación almacenada :-s
--tDP {j V, y si la fuente de la energía de deformación es térmica, su magnitud de~
ser proporcional a kT; en otras palabras,

oe = -!op oV= ckT (9.11-131

en donde e es una constante.l 2 Sin embargo, puesto que la compresibilidad (3 se


define como

(9.11-141

{)p se puede expresar en función de (3 gracias a esta ecuación, y substituir el resu1-


tado en (9.11-13) con el fin de obtener

1 (oV) 2
Oe=---=ckT (9.11-15.
2 {JV0
de donde,

(oV) 2 2cf:JkT
(9.11-161
V~ =-y;-
Si se substituye este resultado en (9 .11-12) y se usa la expresión resultan te
para oe~ en (9.11-11), R se puede escribir como

(9.11-171

Ahora, en una distancia ox, la probabilidad de dispersión (reflexión) es ox/"An.


en donde An es la trayectoria libre media. Para una distancia l/2 (la dimensión lineal
del volumen V0 ), la probabilidad de reflexión es aproximadamente el valor dadc
como R en la expresión anterior. Entonces, l/2"An se puede igualar a R y resolverse
para An, a fin de obtener

(9.11-181

La segunda expreswn procede de la primera, ya que V0 = P /8 y k 0 = 21rjl


Suponiendo que An es independiente de la velocidad cuya validez aproximada se vio
ya en la sección 7.5, An y el tiempo libre medio se relacionan mediante la expre-
sión (7.3-18). Usando esta ecuación y la expresión (5.4-20), :¡= n se puede expresar en
la forma

(9.11-19)

12 Esta constante se relaciona principalmente con la fracción de todos los modos normales
posibles de vibración que contribuyen a una deformación de dilatación del tipo que se vio aquí.
Es evidentemente independiente de la temperatura, la masa efectiva y la constante del potencial
de deformación.
Mecanismos de dispersión y movilidad de los portadores de carga 339

Este cálculo es evidentemente aproximado. Sobre todo, se observa que no se


ha intentado evaluar c. No obstante, ilustra con claridad los principios comprendidos
y también muestra la dependencia de Tn y, por tanto, de la movilidad con respecto
a la temperatura, la masa efectiva y la constante del potencial de deformación. Un
planteamiento completo de acuerdo con la mecánica cuántica 13 da el resultado

(9.11-20}

en donde c11 es la constante de elasticidad para una expansión longitudinal en la


dirección [110]. La movilidad correspondiente es

ei Jsn: eli 4 c11


(9.11-21)
J.l.n = m: = -3- m:312(kT)3f2E;.
Si las superficies de energía constante son elipsoidales más bien esféricas, [de
acuerdo con (9.11-5)], es obvio, que la masa efectiva m:; en (9.11-17, 19 y 20)
debe reemplazarse con la masa efectiva de densidad de estados (9 .1 0-1 O). El factor
adicional de m~ que aparece en (9.11-21), debe ser en este caso, la masa efectiva de
conductividad (9.1 0-25), de tal modo que el factor m:;s 12 del denominador de
(9.11-21), se convertirá en m~ 9 3 1 2 m~. Los cálculos anteriores se refieren específica-
mente a electrones en la banda de conducción; pero el procedimiento para huecos
en la banda de valencia es prácticamente el mismo, y los resultados son idénticos a
los que se acaban de dar, substituyendo las masas electrónicas y la constante del
potencial de deformación de la banda de conducción por sus equivalentes respectivos
de la banda de valencia.
De acuerdo con (9.11-20) y (9.11-21), la movilidad debe variar como T- 3 12 y
m~- 5 12 cuando la dispersión de la red en modo acústico es la interacción dominan-
te. Si se calcula la relación de la movilidad de electrones a la de huecos, como lo
expresa (9.11-21) y su equivalencia para los huecos, se puede demostrar que

J.l.n -_ ( mn*/ mp*)- 5/2("::' /"::' )- 2 .


-e-., (9.11-22)
J.l.p

Puesto que Zc y Zv son casi siempre más o menos idénticas, con frecuencia se
toma como regla práctica que la relación de las movilidades es la relación inversa de
las masas efectivas a la potencia f.
Desafortunadamente los resultados experimentales concuerdan sólo en parte con
las predicciones de (9.11-21). La variación de la movilidad con respecto a la tempe-
ratura en el rango de las temperaturas en donde predomina la dispersión de la red,
en particular, casi siempre es más fuerte que la variación T- 3 / 2 que se encontró con
este análisis. En la tabla 9.4 se indican los valores promedio de la movilidad medida
a 300°K (en donde la dispersión de red es la dominante en todas las muestras,
excepto las muy impuras) y la variación de la movilidad con relación a la tempera-
tura para huecos y electrones en el germanio y el silicio. En materiales con superfi-
cies de energía que son esencialmente esféricas, por ejemplo, Si y Ge tipo p, el
efecto de dispersión por vibraciones de la red de modo óptico es importante, sobre
todo a temperaturas más altas. 14

13 Véase, por ejemplo, W. Shockley, Electrons and Holes in Semiconductors. Nueva York:
D. van Nostrand Inc., (195 Nostrand Inc., (1950) página 539.
14 H. Ehrenerich y A. W. Overhauser, Phys. Rev. 104, 649 (1956).
340 Semiconductores electrónicos uniformes en equilibrio

TABLA 9.4.
Datos de la movilidad medida para el silicio y el germanio

Variación de JJ.n en Variación de llp en


P.• función de la temperatura p., función de la temperatura

Si 1600 T-z-5 500 T-1·3

T-1·66 1900 T-1 3


Ge 3800

Cuando las superficies de energía son elipsoidales, por ejemplo, en Ge y Si


tipo n, los efectos que se originan en la dispersión de electrones de una elipsoide a
otra (dispersión entre valles), que no se ha tomado en cuenta en el cálculo anterior,
también tiene gran importancia. En este proceso, cuando un electrón se transfiere de
una elipsoide a otra, la conservación de la cantidad de movimiento requiere la
generación o la absorción de un fonón cuya energía es del mismo orden que la del
electrón mismo. Por tanto, estos eventos de dispersión no se pueden considerar
como aproximadamente elásticos. Un estudio detallado de este tipo de dispersión.
realizado por Herring, 15 demostró que la dependencia de la movilidad que se ob-
servó en relación con la temperatura, en Ge y Si tipo n, se puede explicar basándose
en la dispersión entre valles aunque, por supuesto, la contribución de modo óptico
es importante sin lugar a dudas. Además, el efecto de los modos transversales de
vibración es mucho mayor cuando la estructura de la banda es de la forma de
"muchos valles",l 6 y, por ende, no se puede omitir por completo para el Ge y el Si
tipo n. Se recomienda consultar los excelentes artículos de Herring 15 y Blatt 17 para
hacer un estudio más detallado de estas cuestiones.
El cálculo del tiempo de relajación para la dispersión de impurezas se basa en
la teoría de la dispersión de partículas cargadas mediante el potencial de Coulomb
de los núcleos, que originariamente fue desarrrollada por Rutherford para explicar la
dispersión de partículas o:. 18 • 19 En un cristal semiconductor que contiene impurezas
de substitución y el potencial de Coulomb debido a los iones cargados, donadores y
receptores, sirven para desviar las trayectorias de electrones y huecos, al igual que lo
hace el potencial de un núcleo pesado que desvía una partícula o: en el experimento
de dispersión de Rutherford.
Si la sección transversal diferencial a(O) se define en tal forma que a(O) dll, es
el área diferencial del haz incidente de partículas que se dispersa a través de un
ángulo 9 en un elemento con un ángulo sólido dll, se puede demostrar mediante la
mecánica clásica o la cuántica,t9 que

( zé* 2 ) --dO.
2 1
a( O) dO. = (9.11-23)
2Km v0 4 (J
sen -
2

15 C. Herring, Bell Syst. Tech. J. 34, 237 (1955).


lli C. S. Smith, Phys. Rev., 94, 42 (1954).
J7 F. J. Blatt, Theory of Mobility of Electrons in So lid State Physics, Advances in Re-
search and Applications. Nueva York: Academic Press (1957), Vol. 4. página 199. Véase particu-
ldrmente la página 332 ff.
18 E. Rutherford, Phil. Mag., 21, 669 (1911).
19 R. B. Leighton, Principies of Modem Physics, Nueva York: McGraw-Hill (1959), página
485 ff.
Mecanismos de dispersión y movilidad de los portadores de carga 341

y que
o Ze 2
tan-=----. (9.11-24)
2 Kam*v~

La geometría de dispersión se ilustra en la figura 9.22 para una interacción de


Coulomb de repulsión (hueco e
ion donador) y en la figura 9.23, para una interac-
ción de Coulomb de atracción (electrón e ion donador); las ecuaciones anteriores se
aplican a ambos casos. La cantidad K es la constante dieléctrica de la substancia, v0
es la velocidad inicial (y final), y a es el "parámetro de impacto" o la distancia
perpendicular entre el centro de dispersión y la proyección de la línea inicial de
acercamiento de la partícula.
Para una sola partícula incidente, el número de colisiones que puede sufrir por
unidad de tiempo en un ángulo sólido dn, claramente es Nv 0 a(O) dQ, en donde N
es el número de impurezas de dispersión por unidad de volumen. Puesto que la
energía se conserva en la interacción de dispersión, las magnitudes de las cantidades
de movimiento inicial y final de la partícula dispersada son las mismas; sin embargo,
puesto que la dirección cambia por acción del ángulo de dispersión (), existe un
cambio consecuente en la cantidad de movimiento de la componente x en sentido
directo de

flpx = Po(l - COS 0). (9.11-25)

Ahora, según (9.11-23), es evidente que casi todas las colisiones producen sólo
un pequeño ángulo de deflexión. No obstante, el tiempo de relajación es el lapso
que se requiere en promedio para que la velocidad directa de la partícula se reduzca
a cero y éste es, obviamente, mucho mayor que el tiempo promedio entre tales
eventos de dispersión. En efecto, de acuerdo con (9.11-25), se puede observar que el
número efectivo de colisiones que destruyen la velocidad es menor que el número
total real de dispersiones, por un factor (1,- cos 0). El número equivalentes de coli-
siones que destruyen la velocidad por unidad de tiempo, comprendiendo un ángulo
de deflexión O en un ángulo sólido dQ no es, por ende, Nv 0 a{O) dQ sino más bien,

dnerr = Nv 0 u(O)(l - cosO) dO. = d(l/r). (9.11-26)

Estado
final

Trayectoria Estado inicial


del hueco
Po
Px =Po

Ion de impureza,
carga +Ze

Figura 9.22. La trayectoria de un hueco que se dispersa mediante la interacción de Coulomb


con un centro de dispersión fijo de carga + Ze.
342 Semiconductores electrónicos uniformes en equilibrio

Figura 9.23. Trayectoria de un electrón dispersado por un centro fijo de dispersión de carga
+Ze.

Esta cantidad es precisamente la recíproca del tiempo de relajación para par-


tículas con esta velocidad inicial específica que sufren colisiones relacionadas con
este ángulo de dispersión en particular. El tiempo total de relajación se puede calcu-
lar integrando sobre el ángulo sólido y promediando sobre las velocidades.
Puesto que la dispersión es independiente del ángulo azimutal <P alrededor del
eje polar, dQ = 21T sen e de, e integrando (9 .11-26) sobre el ángulo sólido, se puede
obtener

-1) = 2nNv0
-r(vo
f"
Bo
2
(
o-(0)(1- cosO) sen OdO= 2nNv 0 2 Ze* 2 )
Km Vo
2
f"
Bo
(1- cosO)esen e dO
4
sen -
2

ze*2 2 ) 2 In sen-= Ze*2 In [ 1 + ( 2 Km*v~


2 2
= -16nNv0 (2 (} 0
8nNv 0 ( 2
)
2 N 1 ,3
) ]

Km v0 2 2Km v0 Ze
(9.11-27)
Al efectuar la integración, es mejor expresar todas las funciones trigonométricas
de acuerdo con el argumento e12. El límite superior de la integral debe ser e=-¡;_
que corresponde a un "choque directo" que refleja a la partícula incidente de nuevo
hacia su trayectoria original. Para una colisión de esta naturaleza, el parámetro de
impacto a es cero. El límite inferior sería G = O para un centro de dispersión aislado
(que daría origen a una sección tranversal para la dispersión infinita); pero dentro
del cristal, la influencia de un centro de dispersión individual se extiende hacia
afuera sólo a una distancia del orden del espaciamiento medio entre los iones de
dispersión Por tanto, conviene "cortar" la dispersión de un ion en particular cuando
el parámetro de impacto a es igual a d/2, en donde d = N- 1 / 3 es la distancia media
entre los átomos de impureza. Entonces, el límite inferior de la integral se encuentra
en
1
a= 2N1/3 (9.11-28)

que, de acuerdo con (9.11-24), corresponde a

(9.11-29)
Mecanismos de dispersión y movilidad de los portadore~ de carga 343

Los cálculos anteriores permiten expresar a -r(v 0) en la forma

(9.11-30)

Ahora es necesario calcular T por medio del proceso acostumbrado de los


promedios, de acuerdo con el cual,

(9.11-31)

Esta integral no se puede evaluar con prec1s10n por medios analíticos; pero si
se observa que el término logarítnúco del denominador sólo varía muy lentamente
con respecto a v0 , en comparación con el factor de multiplicación vóe-m*vo 2 12 kT,
se puede obtener un valor aproximado suponiendo que el término logarítmico tiene
un valor constante que es igual al valor que alcanza cuando el factor de multiplica-
ción es máximo. Se puede asegurar que este valor máximo se obtiene para Vo =
.J7kT/m*. Haciendo que v0 sea igual a esta cantidad en el término logarítmico,
eliminándolo de la integral y evaluando las integrales restantes de acuerdo con la
tabla 5.1, se puede obtener

(9.11-32)

por lo cual, la movilidad estará dada por

(9.11-33)

Conwell y Weisskopf11 , 20 desarrollaron originalmente este método de cálculo y


(9.11-33) se cita a menudo como la fórmula Conwell-Weisskopf. Brooks y Herring 21
desarrollaron el mismo cálculo de un modo algo más refinado y su resultado es
similar, excepto que el término logarítmico que varía con lentitud es algo distinto.
Las dependencias en relación con la temperatura y la concentración son idénticas en
ambos casos. En el cálculo anterior, el promedio se sacó suponiendo que las super-
ficies de energía eran esféricas. El cálculo para superficies elipsoidales es mucho más
complejo y no se efectuará aquí; la magnitud del tiempo de relajación se verá
afectada, pero no así las dependencias de la temperatura y la concentración. En

20 Este parece un error en el artículo original de Conwell-Weisskopf que ha persistido en


casi todos los estudios de este tema realizados por otros autores. Conwell-Weisskopf indican en
su artículo original [su ecuación (18)] que el máximo de la función que multiplica el término
logarítmico del integrando en el numerador de (9.11-31) ocurre en v2 =6kT/m, en tanto que
basta un simple cálculo para demostrar que en realidad se produce en 7 kT/m. Esto explica el
factor 7/2 en el argumento del término logarítmico de (9.11-33) que va en lugar del factor 3,
que es el que aparece en la fórmula original de Conwell-Weisskopf. La corrección aplicable al
resultado original es obviamente m u y pequeña y no afecta su validez general.
21 H. Brooks, Phys. Rev. 89, 879 (1951).
344 Semiconductores electrónicos uniformes en equilibrio

todo el desarrollo se supuso que los átomos de impurezas estaban completamente


ionizados; a temperaturas muy bajas¡ esto no es exacto. En estas circunstancias, se
debe considerar que la cantidad N de las ecuaciones anteriores representa la con-
centración exclusiva de los centros de impureza ionizados, como lo indican (9.5-4) o
(9.5-8). Esto introduce una dependencia adicional en relación con la temperatura.
pero es importante sólo a temperaturas muy bajas.
De acuerdo con la ecuación (9.11-33), cuando domina la dispersión de impu-
rezas ionizadas, se debe encontrar que la movilidad es proporcional a T3 12 y que
presenta una dependencia inversa en relación con la concentración de impurezas.
Aunque es difícil obtener especímenes en los que la dispersión de impurezas deter-
mine solamente la movilidad, estas predicciones se han verificado por la experiencia.
cuando menos de un modo aproximado. En la figura 9.24 se ilustra una gráfica de
la movilidad en función de la concentración de impureza para el germanio. En
concentraciones reducidas de impurezas, la interacción de dispelSión dominante es la
de la red, es independiente del contenido de impureza, y por tanto la movilidad
[como se da, por ejemplo, en (9.11-21)], también es independiente de la densidad de
impurezas. A altas concentraciones de átomos de impurezas, la dispersión de impu-
rezas ionizadas se convierte. en el proceso de dispersión más importante y la movi-
lidad decrece al incrementarse la densidad de impurezas, como lo predice la fórmula
Conwell-Weisskopf, (9.11-33). En el rango intermedio las interacciones de dispersión
de ambos tipos son importantes y la movilidad 1J. debe expresarse como IJ- 1 =
IJ.11 + IJ/1 en donde IJ.¡ es la movilidad que puede atribuirse sólo a la dispersión de
impurezas ionizadas y IJ.¡ la que se puede encontrar en los casos en que la dispersión
de la red es el único proceso importante.
Además de la dispersión de la red y la de impurezas, hay otras interacciones
de dispersión que tienen una importancia ocasional. Los centros de impurezas neu-
tras, al igual que los ionizados, pueden producir una dispersión apreciable, si existen
en cantidades suficientes. Erginsoy 2 2 realizó un estudio de este tema. Se ha descu-
bierto que la dispersión de impurezas neutras es independiente de la temperatura y.
por tanto, puede tener importancia a temperaturas muy bajas cuando la dispersión
de la red es despreciable y la mayoría de las impurezas no están ionizadas. Es más.
las vacantes, átomos intersticiales, dislocaciones, fronteras de grano y las superficies
de la muestra pueden dispersar huecos y electrones aunque, en muchos casos, la

4000
¡.<¡ ------------
3000

2000

1000

10 20 IC 19 1018 10 17 10 16 10 1 ~ 10 14 10 13
Densidad de donadores Nd
(Germanio tipo n, 300°K)
Figura 9.24. Efecto de la concentración de impurezas en la movilidad de los electrones, a la
temperatura ambiente, en el germanio tipo n, de acuerdo con la teoría Conwell-
Weisskopf de la dispersión de impurezas. [Tomado de E. M. Conwell, Proc. I.R.E.,
40: 1327 (1952).]

22 C. Erginsoy, Phys. Rev., 79, 1013 (1950).


Mecanismos de dispersión y movilidad de los portadores de carga 345

dispersión atribuible a estos medios se desecha en comparación con la dispersión de


red o impurezas.
La exposición del comportamiento volumétrico de semiconductores dada en
este capítulo de ningún modo es completa. En realidad, no se han tratado las
propiedades térmicas y ópticas en absoluto y, por falta de espacio, ha sido necesario
omitir una explicación de los efectos sumamente interesantes que se pueden observar
en semiconductores sometidos a esfuerzos hidrostáticos o uniaxiales. 23 No obstante,
se espera que este estudio haya aclarado los campos muy básicos e importantes y
haya desarrollado métodos de utilidad general en la investigación de algunos de los
temas que no se han visto en detalle.

EJERCICIOS
l. En papel semilogarítmico, haga las gráficas de la concentración de los portadores intrín-
secos n¡ en función de 1/T para (a) germanio, (b) silicio, (e) InSb (LlE=0.22 eV, m;!; =0.013
m 0 , mp = 0.18 mo), (d) GaAs (Á€= 1.5 eV, m~= 0.1 m 0 , mp = 0.4 m 0 ). Asegúrese de que las
gráficas indiquen con claridad la variación de n¡ en función de T sobre el rango comprendido
entre 10° y 500°K.
2. Estudie un semiconductor intrínseco bidimensional en el que, al igual que en los sis-
temas metálicos bidimensionales, las funciones de densidad de estados son

e> ec

g(e) =O e.< e< ec

g.(e) de= (41Tm: /h 2 ) de e< e.

Demuestre, utilizando sólo la estadística de Fermi y sin recurrir a la aproximación de Boltz-


mann, que para el caso en que mp/m~ = 2, la posición del nivel de Fermi se puede expresar
como
1 kT 8 ~
ec- ef = 2 !le- -zln 3 + kTin cos 3'

en donde

~ =
32 ]1/2
tan- 1 [ 27 (r"''n)- 1

3. Haga las gráficas de la conductividad para el germanio tii?o p y n en función de la


concentración neta de impurezas J/'!.d- Ngl para valores de INd- N0 1 que van de O a 10 1 'cm- 3
a las siguientes temperaturas: 80 K, 300 K, 500°K. Suponga que J.l.n varía como r- 1 •65 Y f.lp
como r- 3 ·2 . Haga estas gráficas en papel logarítmico.
4. ¿Para qué valores de concentración de portadores n 0 , Po es mínima la conductividad de
un semiconductor? ¿Cuál es el valor del contemdo neto de impurezas ¡Nd- N 0 i que esto
implica?
5. Para un semiconductor con superficies de energía esféricas tanto en la banda de conduc-
ción como en la de valencia, pero con dos especies de huecos, demuestre que el coeficiente de
Hall de campo pequeño se puede escribir como sigue

23 R. W. Keyes, "The Effects of Elast1c Deformation on the Electrical Conductivity of


Semiconductors." en Salid State Physics, Advances in Research and Applications. Nueva-York:
Academic Press (1960), Vol. 11, página 149.
346 Semiconductores electrónicos uniformes en equilibrio

en .do~de Pot. p 02 son las .concentraciones, 1Jp 1 , 1Jp2 las movilidades y Tp 1, Tp 2 los tiempos de
relajac!On para las dos especies de huecos.
6. Para cada una de las superficies de energía constante del germanio, encuentre los ten-
sores individuales de conductividad a~'J relacionados con los ejes cúbicos como ejes de coorde-
nadas. En el germanio, las superficies de energía constante son cuatro elipsoides cuyos ejes
principales caen a lo largo de las cuatro direcciones (111). Demuestre que el resultado (9.10-23)
se obtiene sumando totalmente las elipsoides.
7. Demuestre que si el campo estático está en la dirección [100]. sólo se observará un pico
de resonl!-ncia de ciclotr~n a la frecuencia w = ~eJ!/c)[(mf¡ +?ml>!}mfiml2 1I¡2 en el germanio. ~Qué
resonancias Se observanan COn el campo estat!CO en fa dueCCIOn r111 l7
8. Con las leyes de la mecánica clásica, derive la fórmula de dispersión de Rutherford
(9.11-23) y la relación asociada (9.11-24).
9. Se ha determinado que un espécim de semiconductor tiene una resistividad de 12.5
ohm-cm. El espécimen tiene 1 cm de longitud, por 5 mm de ancho y 1 mm de grosor. Se hace
fluir una corriente de 1 mA a lo largo de la dimensión más larga de la muestra y se mide un
voltaje de Hall de 5 m V en la anchura de 5 mm de la muestra, cuando se usa un campo
magnético de 2000 gauss. ¿Cuál es la concentración de portadores y la movilidad de Hall de los
portadores en la muestra? Se puede suponer que la muestra es extrínseca, que las superficies de
.:nergías son esféricas y que la dispersión acústica de modo acústico es el proceso de dispersión
dominante.
10. Escriba los detalles relacionados con la maximización de la expresión (9.5-2) por el
método de los multiplicadores lagrangeanos, completando así la derivación en (9.5-3).
11. Demuestre que (9.3-6) y (9.3-15) se pueden transformar de tal modo que indiquen

12. Explique físicamente las características principales de las curvas experimentales ilustra-
das en la figura 9.13, y analice las relaciones entre las tres gráficas separadas.

LECTURAS RECOMENDADAS

A. C. Beer, "Galvanomagnetic Effects in Semiconductors"; suplemento 4 en So/id State Physics.


Advances in Research and Applications, Academic Press., Inc., Nueva York (1963).
F. J. Blatt, "Theory of Mobility of Electrons in Solids," en So/id State Physics, Advances in
Research and App/ications, Vol. 4, Academic Press., Inc., Nueva York (1957).
H. Brooks, "Theory of the Electrical Properties of Germanium and Silicon," en Advances in
Electronics and Electron Physics, Vol. 7, Academic Press, Inc., Nueva York (1955).
E. Burstein y P. H. Egli, "The Physics of Semiconductor Materials," en Advances in Electronics
and Electron Physics, Vol. 7, Academic Press., Inc., Nueva York (1955).
H. Y. Fan, "Valence Semiconductors, Germanium and Silicon," en So/id State Physics, Advances
in Research and Applications, Vol. 1, Academic Press., Inc., Nueva York (1955).
R. W. Keyes, "The Effect of Elastic Deformation on the Electrical Conductivity of Semiconduc-
tors," en Salid State Physics, Advances in Research and Applications, Vol. 11, Academic
Press, Inc., Nueva York (1960).
W. Shockley, Electrons and Hales in Semiconductors, D. van Nostrand Co., lnc., Nueva York
(1950).
R. A. Smith, Semiconductors, Cambridge University Press, Nueva York (1961).
cAPITuwlO
Exceso de portadores
en semiconductores

10.1 INTRODUCCION

En un metal prácticamente es imposible alterar la concentración volumétrica de


los portadores de carga libres. Se puede introducir un exceso de portadores; pero
sólo induciendo una carga eléctrica en el espécimen. En estas condiciones, la den-
sidad de carga en exceso reside esencialmente en la superficie del metal y no se
afecta la concentración volumétrica de los portadores de carga. En esta situación no
se observa ningún cambio en las propiedades volumétricas de transporte.
Sin embargo, en un semiconductor se puede alterar profundamente la concen-
tración de portadores de carga en el material sin introducir ninguna densidad de
carga eléctnca importante. Esto se logra gracias a que pueden tenerse simultánea-
mente dos tipos de portadores de carga, huecos y electrones; si los huecos y los
electrones en exceso se introducen en pares, se pueden crear grandes desviaciones de
los valores de equilibrio térmico de la concentración volumétrica de portadores sin
que se forme ninguna densidad de carga neta. La formación de estas densidades de
portadores en exceso del nivel de equilibrio va acompañada de una modulación
notable de la conductividad volumétrica del material, como lo establece {9.7-6). Esta
posibilidad es la que permite el uso de elementos semiconductores como dispositivos
electrónicos tales como rectificadores, transistores y unidades de conmutm:ión. Si se
extraen huecos y electrones en pares, se pueden obtener concentraciones volumé-
tricas de portadores inferiores a los valores de equilibrio, con la misma facilidad con
que se crean concentraciones en exceso mediante la introducción o inyección de
pares de portadores de carga. 11, absorbe. Por tanto, el espectro de absorción de un
semiconductor se caracteriza siempre por un cambio muy rápido
Los portadores excedentes se pueden crear en los semiconductores iluminando
el material con una frecuencia tal que la energía del fotón hwo sea igual o sobre-
pase a la energía de la banda prohibida ~€. En estas condiciones, los fotones inci-
dentes tienen la suficiente energía para romper los enlaces covalentes de la red de
pares de electrones, liberando electrones libres y dejando los huecos en los sitios de
excitación. Los electrones y los huecos en exceso que se crean de esta manera en
pares, contribuyen a la conductividad del cristal, que luego se incrementa bajo la
iluminación, siendo el aumento proporcional a la intensidad de la luz. Este fenó-
meno se denomina fotoconductividad y es muy característico de todos los semicon-
ductores. Puesto que en la creación de cada par electrón-hueco se absorbe un fotón,
la luz con una longitud de onda lo suficientemente corta para que la energía del
fotón sobrepase ~€, se absorberá con mucha fuerza dentro del cristal. Por otra

347
348 Exceso de portadores en semiconductores

Coeficiente de <T (t)


absorción Borde de
absorción
(hw 0 : Ó<)

~~x,
Opaco 1 Transparente Tiempo
~----------~.r¡------•X
1-- Luz ---l Obscuro
Obscuro (w>w 0 )

(o) (b)

Figura 10.1. (a) Espectro de absorción de un semiconductor típico cerca del borde de absor-
ción fundamental. (b) Respuesta fotoconductiva de un cristal semiconductor a una
luz con una longitud de onda lo suficientemente corta para excitar pares electrón-
hueco en exceso.

parte, la luz con una longitud de onda mayor, cuya energía de fotón es inferior a
~e, no puede crear pares electrón-hueco y raramente se absorbe. Por tanto, el
espectro de absorción de un semiconductor se caracteriza siempre por un cambio
muy rápido en el coeficiente de absorción, a una longitud de onda que corresponde
a la energía del fotón ~e, teniendo el cristal una mayor fuerza de absorción para
longitudes de onda más corta y siendo casi transparente para longitudes de onda más
largas, como se ilustra en la figura lO.l(a). La región de transición brusca de la
opacidad a la transparencia se denomina borde de absorción. En el germanio, el
borde de absorción se produce en el infrarrojo cercano a aproximadamente X =
1.75 Jl., correspondiendo a ~€ = 0.7 eV, y en el silicio, a alrededor de 1.13 Jl., corres-
pondiendo a ~e= 1.12 eV. La banda de energía prohibida ~e se puede determinar
con precisión en el espectro de absorción, midiendo la longitud de onda a la que se
produce el borde de absorción. En la figura 1O.l(b) se muestra la respuesta fotocon-
ductiva de un semiconductor a la luz con una longitud de onda lo suficientemente
corta para crear pares electrón-hueco.
Los portadores excedentes también se pueden crear en cristales semiconduc-
tores por medio de haces de partículas de alta energía (electrones, protones, par-
tículas a), rayos X, radiación 'Y y mediante contactos metal-semiconductor debida-
mente polarizados o uniones p-n. Volveremos sobre estos conceptos más adelante.

10.2 COMPORTAMIENTO DEL TRANSPORTE DE LOS PORTADORES


EXCEDENTES; LAS ECUACIONES DE CONTINUIDAD

En cualquier cristal semiconductor, continuamente se generan pares electrón·


hueco por medios térmicos o de otra índole, y se están recombinando de un modo
continuo. En equilibrio térmico, el único proceso de generación es el térmico. La
velocidad a la que se generan los pares y a la que se recombinan debe ser idéntica:
de otra manera, la concentración de electrones. y huecos crecería o declinaría como
una función del tiempo. La velocidad de generación térmica de equilibrio
g 0 ( cm- 3 seg- 1 ) es el número de pares electrón-hueco generados por unidad de volu-
men en unidad de tiempo, mediante la ruptura térmica de enlaces covalentes. Esta
Comportamiento del transporte 349

cantidad es una función de la temperatura y ciertos parámetros del cristal; pero es


independiente de la concentración de electrones y huecos. La velocidad de recom-
binación se relaciona con el tiempo medio que transcurre entre la generación de un
electrón o un hueco y su recombinación subsecuente. Esta cantidad se conoce como
tiempo medio de vida del portador. Si sólo se tuviera un portador de una especie
dada por unidad de volumen del cristal, en cualquier tiempo en particular, el nú-
mero de sucesos de recombinación por unidad de volumen por segundo de este tipo
de portador sería 1/r, en donde T es el tiempo de vida de dicha especie de porta-
dores.1 Cuando se tienen n portadores por unidad de volumen, la velocidad de
recombinación (número de eventos de recombinación por unidad de volumen por
unidad de tiempo) es n veces mayor, es decir, n/r. En las condiciones de equilibrio
térmico, la concentración de electrones es n 0 y la concentración de huecos es p 0 y,
puesto que las velocidades de generación y recombinación de huecos y electrones
deben ser iguales en estas circunstancias, es obvio que

y (10.2-1)

en donde g 0 n y g 0 P son las velocidades de generac10n térmica en equilibrio para


electrones y huecos, respectivamente, y en donde T no y T po son los tiempos de vida
promedio para las especies de portadores respectivas en la situación de equilibrio.
Además, puesto que la generación térmica siempre da como resultado la producción
de pares electrón-hueco, se está generando un hueco por cada electrón y g0 n y g0 p
deben ser iguales, de donde,

(10.2-2)

La igualdad de las velocidades de generación y recombinación se aplica a todos


los sistemas de estado estacionario, aun los que no están en equilibrio térmico. La
igualdad de las velocidades de generación de electrones y huecos, así como la igual-
dad de las velocidades de recombinación de electrones y huecos, deben conservarse
también en sistemas que no se encuentran en la situación del estado estacionario, ya
que la generación (o recombinación) de un electrón va acompafíada inevitablemente
de una generación (o recombinación) de un hueco. No obstante, en sistemas que no
tienen un estado estaeionario, las velocidades de generación y recombinación para elec-
trones (o huecos) pueden ser diferentes. En todo caso, es necesario escribir siempre

y (10.2-3)

en donde gn y gP son las velocidades reales de generación, n y p las concentraciones


locales y ·r n y T P el tiempo de vida de electrones y huecos, respectivamente. En

1 Hasta ahora se han usado los símbolos T n• T P y T para representar los tiempos de
relajación asociados con procesos de dispersión. Sin embargo, los mi;;mos símbolos se usan
universalmente en las obras impresas para representar también los tiempos de vida de recombina-
ción. Puesto que esta práctica ha quedado justificada por los numerosos años de uso y, dado
que no se desea adoptar una notación muy compleja, se usarán los mismos símbolos para los
dos grupos de cantidades. No obstante, de aquí en adelante se dará por sentado que T, Tn y T P
se refieren siempre a los tiempos de vida de recombinación, a menos que se especifique otra
cosa.
350 Exceso de portadores en semiconductores

X x+dx

Figura 10.2. Flujo de portadores que entran y salen de un pequeño elemento de volumen del
cristal.

estas ecuaciones, las velocidades de generac10n gn y gP, al igual que las concentra-
ciones n y p, y los tiempos de vida r n y T P, deben considerarse generalmente como
funciones de las coordenadas de espacio y tiempo, dentro del cristal.
Ahora se verá una región del cristal cuyas dimensiones son dx, dy, dz, como
se indica en la figura 10.2. Supóngase que hay unas densidades de flujo de partícu-
las JP y Jn de huecos y electrones, respectivamente, que fluyen dentro y fuera de
esta región. La componente x de J P en x + dx se puede expresar en función de J P
en x, haciendo una expansión de Taylor de lpx(x + dx); en el límite en donde dx
se hace pequeña, sólo los dos primeros términos son importantes, de donde,

()Jpx
JPix + dx) = JPx(x) + ox dx. (10.2-4)

El incremento neto en el número de huecos dentro de la región, por unidad


de tiempo, originados en una diferencia en las componentes x de JP en las dos caras
ABCD y EFGH, entonces es

[Jpix)- Jpx(x + dx)] dy dz = a:


oJ
dx dy dz. (10.2-5)

También se tendrán términos similares que se originan en la diferencia de las


componentes y de JP en las caras ACGE y BDHF, y en la diferencia de las compo-
nentes z de JP en ABFE y CDHG. El incremento neto total por unidad de tiempo
en el número de huecos dentro de la región, que se origina debido a estos términos
es - V • JP dx dy dz. Si los procesos de generación y recombinación son activos
dentro del volumen, habrá gp dx dy dz huecos generados y (pjr P) dx dy dz que se
pierden por recombinación por unidad de tiempo dentro de la región de interés. La
suma algebraica de todas estas cantidades representa el incremento neto total del
número de huecos dentro del volumen dx dy dz por unidad de tiempo que es,
evidentemente, (opjot) dx dy dz. Si se saca la suma algebraica de las diferentes con-
tribuciones, se iguala a (opfot) dx dy dz y se anula el elemento de volumen en
ambos lados de la ecuación, se puede demostrar que

P op (10.2-6)
-V·J P +g p - -
t"
=Ot
-'
p
Comportamiento del transporte 351

mientras que con un cálculo similar para los electrones dentro del mismo elemento
de volumen, se obtendrá
n on
-V ' Jn + Un - - = -0 • (10.2-7)
'n t

Las expresiones ( 10.2-6) y ( 10.2-7) se citan como las ecuaciones de continui-


dad para los electrones y los huecos. En condiciones apropiadas de frontera, las
soluciones de estas ecuaciones describen la distribución de la concentración de elec-
trones y huecos en función de las coordenadas del espacio y el tiempo, y propor-
cionan una descripción completa del comportamiento de transporte de electrones y
huecos dentro del semiconductor en condiciones que no sean las de equilibrio. Para
llegar a soluciones explícitas de las ecuaciones de continuidad, es necesario expresar
la corriente en función de la concentración. Esto se logra escribiendo la densidad del
flujo de partículas como la suma de una densidad de flujo de difusión y una
densidad de corriente de arrastre producida por cualquier campo eléctrico que pueda
estar presente. En consecuencia, se puede escribir

(10.2-8)

(10.2-9)

El origen de la componente de corriente debida al campo, en las ecuaciones


anteriores, queda perfectamente en claro. 2 El término de difusión establece que
siempre que exista un gradiente de concentración Vp, se tendrá un flujo neto de
corriente de partículas de las regiones de alta concentración a las de baja concentra-
ción, proporcional al gradiente de la concentración en cualquier punto. Este flujo de
difusión es análogo al flujo de calor en presencia de un gradiente de temperatura. La
constante de proporcionalidad se denomina coeficiente de difusión o difusibilidad. Se
puede demostrar rigurosamente que la componente de difusión de la corriente debe
tener esta forma, aplicando los métodos desarrollados en el capítulo 7, principiando
con la ecuación de Boltzmann y suponiendo la aproximación del tiempo de relaja-
ción (7.24). No se incluirá aquí la reproducción de los detalles de esta demostra-
ción, sino que se asignarán como un ejercicio para el lector, lo cual constituye una
buena práctica en el uso de la teoría del transporte que se vio con anterioridad.
Cuando la trayectoria libre media es independiente de la velocidad, que es una
aproximación aceptable en los semiconductores, en donde la dispersión de red es el
proceso dominante, resulta que los coeficientes de difusión de los electrones y los
huecos se pueden expresar como

y (10.2-10)

en donde "-n y Ap son las trayectorias libres medias del electrón y el hueco, y en y
cP son las velocidades térmicas medias de los electrones y los huecos, respectiva-
mente. En las circunstancias en que ( 10.2-10) es válida, las trayectorias libres medias

2 En (10.2-8) y (10.2-9) se supone que no hay campos magnéticos presentes o cuando


menos, que, su efecto en los portadores es pequeño en comparación con el del campo eléctrico.
Los símbolos ln y Jp se usarán para representar la densidad de flujo de partícula en tanto que
In(=- eJn) y lp(= eJp) se usarán para la densidad de la corriente eléctrica.
352 Exceso de portadores en semiconductores

y los tiempos de relajación de electrones y huecos están relacionados por medio de


(7 .3-18). Si las ecuaciones (10.2-10) se expresan en función de los tiempos de
relajación, y si las velocidades térmicas se representan por (5.4-20), con el uso de las
masas efectivas apropiadas, se puede demostrar fácilmente, utilizando (7.3-13), que
los coeficientes de difusión se pueden representar de acuerdo con las movilidades
como sigue

p.PkT
y D =--. (10.2-1!)
P e
Estas relaciones entre los coeficientes de difusión y las movilidades se conocen
como relaciones de Einstein. Aunque se derivaron antes basándose en suposiciones
muy restrictivas, se puede demostrar que se aplican a todos los sistemas que obede-
cen a la estadística de Boltzmann. En realidad, si se incluye una constante numérica
apropiada, se puede demostrar que se aplican también a los sistemas de Fermi.
Si las ecuaciones de la corriente ( 10.2-8) y ( 10.2-9) se substituyen en las
ecuaciones de continuidad (10.2-6) y (10.2-7), esta última se puede escribir como
p iJp
DpV2 p - p. pV • (pE) + gp - - = -iJt
't p
(10.2-l2J

y
n iJn
DnV 2 n + p.nV· (nE) + gn - -
..,
=ot
-. (10.2-13)

Los términos de divergencia en las ecuaciones anteriores se pueden transformar


a una forma más manejable utilizando la identidad vectorial

V· (</JA) =A· V</J + </JV ·A (10.2-14)

que es aplicable a cualquier vector A y cualquier función escalar 1/J. De igual manera,
conviene expresar las velocidades de generación como la suma de la velocidad de
generación térmica, más la velocidad a la que se generan los portadores en exceso de
la velocidad de generación térmica, de donde,

g, = gon + g~ y gp = gOp + g~, (10.2-15)

en donde g~ y g~ son las velocidades de generación del exceso. Las velocidades de


generación térmica pueden expresarse ahora en función de las concentraciones en
equilibrio y los tiempos de vida por medio de (10.2-l). Después de efectuar estas
transformaciones, las ecuaciones de continuidad (10.2-12) y (10.2-13) toman la forma

(10.2-16)

( -n - -n 0 ) iJn
D,V 2 n + p.,(E • Vn + nV • E) + g~ - = -. (10.2-17)
-r,. -r,.o iJt

El campo E se puede expresar como la suma del campo aplicado y el campo


interno que se origina por el hecho de que las partículas en difusión están cargadas,
por lo cual,

E = E;nt + Eap. (10.2-18)


Comportamiento del transporte 353

Concentración

t=o

l>o
-
Etnt

-x

(a) (e)

Figura 10.3. Etapas sucesivas en la dispersión difusiva de una distribución de pru:es electrón-
hueco en exceso, que inicialmente tiene la forma de una función 8 en un semi-
conductor intrínseco.

El campo interno tiene su origen en el hecho de que las trayectorias libres


:nedias (y, por ende, los coeficientes de difusión) de los electrones y los huecos
pueden ser diferentes. Si los electrones y los huecos pudieran moverse por completo
de un modo independiente entre sí, las especies de difusión más rápida tenderían a
adelantarse a las especies de difusión más lenta, dejando a estas últimas totalmente
detrás. Sin embargo, ya que las partículas de difusión están cargadas, cuando esto
sucede en realidad, comienza a producirse una separación de las cargas positivas y
negativas, se establece un campo eléctrico interno que tiende a retardar a las par-
tículas de difusión rápida y a impulsar a las más lentas. Este es el campo Eint de la
ecuación (10.2-7). Finalmente, este campo se hace lo suficientemente fuerte para
contrarrestar por completo cualquier tendencia de las distribuciones de carga posi-
tivas y negativas a separarse más todavía; entonces, las distribuciones de partículas
positivas y negativas se difunden juntas y el coeficiente de difusión efectiva es
mayor que el de las especies de difusión más lenta, pero menor que el del tipo de
difusión más rápido. Este fenómeno, denominado difusión ambipolar, se ilustra en la
figura 10.3. Como se verá en seguida, un efecto similar altera el carácter del movi-
miento de arrastre que se produce cuando existe un campo eléctrico aplicado.
En las ecuaciones (10.2-16) y (10.2-17), es evidente, de acuerdo con la expo-
sición anterior, que en realidad contienen tres cantidades desconocidas, n, p y E.
Para encontrar estas cantidades, es necesario recurrir a otra ecuación. El conjunto de
ecuaciones se puede completar escribiendo la expresión de Poisson que relaciona el
campo eléctrico y la densidad neta de carga e(p - n + Nd -Na+ Pa - nd ). De acuer-
do con esto,

V. E= 4np = 4ne(p- n + N 4 - Na+ Pa- n4) (10.2-19)


K K

en donde K es la constante dieléctrica. Debe hacerse notar que, puesto que el


campo aplicado Eap no tiene fuentes o pozos internos, su divergencia es cero, por
lo cual, de acuerdo con (10.2-18)

V· E= V· E;nt· (10.2-20)

Las ecuaciones (10.2-16), (10.2-17) y (10.2-19) forman ahora un conjunto de


tres ecuaciones que en principio, pueden resolverse para las tres incógnitas n, p y
Eint·
Desafortunadamente parece no existir un medio para llegar a una solución de
estas tres ecuaciones de una manera analítica directa. Por tanto, es necesario hacer
354 Exceso de portadores en semiconductores

una aproximación física razonable que permita llegar a una solución que, aunque no
sea exacta, sea adecuada para la mayoría de los casos de importancia práctica. La
aproximación que se utilizará con este fin es la condición de neutralidad eléctrica o
la suposición de balance de carga. Se supondrá en (10.2-16) y (10.2-17) que la
densidad de electrones en exceso ón = n- n 0 se equilibra mediante una densidad de
huecos en exceso óp = p- Po. Es evidente que esto no es del todo cont:cto, porque
entonces, jamás se podría establecer un campo interno, y es este campo interno,
originado en la disparidad básica de las trayectorias libres medias de electrones y
huecos, el que tiende a conservar unidas las distribuciones de densidad de electrones
y huecos de difusión. N o obstante, esta pequeña diferencia entre la densidad de
electrones y huecos (en comparación con las densidades de excesos de portadores
propiamente dichas) es lo que se requiere normalmente para crear este campo in-
terno. La aproximación del equilibrio de carga es casi siempre apropiada en lo que
respecta a las densidades de portadores de las ecuaciones ( l 0.2-16) y (1 0.2-17). Sin
embargo, no es de esperarse que se use la suposición de neutralidad de carga en
(10.2-19). Al contrario, se puede calcular el campo Eint a partir de (10.2-16) y
(1 0.2-17) empleando la suposición de neutralidad de carga, ya que entonces se ten-
drán sólo dos incógnitas, óp y E¡n t' en estas ecuaciones. Este valor calculado de
Eint se puede utilizar en (10.2-19) para determinar la densidad de la fuente (y, por
tanto, la disparidad en las densidades de electrones y huecos) requerida para mante-
ner el campo. Si la densidad de la fuente calculada es sólo una fracción pequeña de
las densidades de electrones y huecos en exceso calculadas en (1 0.2-16) y (1 0.2-17), se
puede tener la seguridad de la consistencia de los cálculos y la validez de las suposiciones
en las que se basan; de otra manera, será necesario llegar a la conclusión de que los
resultados no concuerdan con las hipótesis originales y los cálculos están equivocados.
Más tarde se verá que el primer caso es el que se encuentra casi siempre en la
práctica real. 3
Por tanto, siguiendo esta línea de razonamiento, se supondrá inicialmente que

bn = n- n 0 = p- Po= bp. (10.2-21)

Este estudio se limitará a muestras homogéneas, en donde la densidad de impurezas


es uniforme en todo el material. Para tales muestras, n 0 y p 0 son constantes y los
gradientes y las derivadas del tiempo para n y p son iguales a los gradientes y a las
derivadas del tiempo de ón y óp, respectivamente. De igual manera, de acuerdo con
(10.2-3), se ve claramente que los términos de generación y recombinación de
(10.2-12) son iguales a los de (10.2-13). Los términos de generación y recombina-
ción de (10.2-16), que se originan directamente de los términos correspondientes de
(10.2-12) son iguales a los términos de generación y recombinación de (10.2-17) que
se originan en la misma forma que los términos de (10.2-13). Si se emplean estos
resultados en (10.2-16) y (10.2-17), se puede demostrar que

DPV 2 (bp)- J.lp(E. V(bp) + pV. E)+ g'- (Po+'P bp - Po)


!Po
o(bp)
- = --
O(
(10.2-22)

2
D"V (bp)

+ J.ln(E • V(i5p) + nV ·E) +.g'- (Po +bp - Po)
- =-
o(bp)
(10.2-23)
Tp !Po O(

3 W. van Roosbroeck fue el primero en adoptar esta línea de planteamiento para el caso
del semiconductor [Phys. Rev., 91, 282 (1953)]; pero mucho antes se utilizaron métodos simila-
res para resolver problemas relacionados con el transporte de electrones e iones en descarga~
gdseosas, que son muy similares.
Comportamiento del transporte 355

en donde
(10.2-24)

El término que comprende V • E se puede eliminar multiplicando (1 0.2-22)


por nJJ.n, (1 0.2-23) por PJJ.p y sumando las dos ecuaciones (observando en (1 0.2-21)
que n - p = n 0 - Po) para obtener

npnDp + PJ1pDn V2(bp) _ llnJ1p{no- Po) E. V(bp) + g' _(Po+ bp _Po)= iJ(bp).
nJln + PJlp nJ1n - Pllp 7: p 7: PO iJt
(10.2-25)

Ahora, en el coeficiente del primer término anterior, las movilidades se pueden


expresar en función de los coeficientes de difusión mediante las relaciones de
Einstein (10.2-11). Por tanto, la ecuación (10.2-25) se puede escribir como sigue

bp iJ(bp)
D*V 2 (bp)- 11*E • V(bp) + g' -- = -- (10.2-26)
r iJt

en donde

D* = ( n + p )D .D P = -,---(_n-'-0-=-+~P_o_+_2.,-b_p_)D_n-::-D~P:-=- (10.2-27)
nDn + pDP (no+ bp)Dn +(Po+ bp)Dp

(10.2-28)

y en donde T es un "tiempo de vida del portador en exceso" definido por

bp Po + bp Po n 0 + bp n0
(10.2-29)
7:

La concentración en exceso de las otras especies de portadores, on, es por supuesto


igual a op de acuerdo con la suposición del balance de carga (10.2-21).
La expresión ( 10.2-26) es la ecuación de transporte ambipolar que obedecen la
densidad de electrones y huecos en exceso. 4 El coeficiente de difusión ambipolar D*
y la movilidad ambipolar p*, de acuerdo con (1 0.2-27) y (10.2-28) en general, son
dependientes de la concentración op de portadores en exceso. Es imposible resolver
(10.2-26) en estas circunstancias y casi siempre se debe proceder a partir de este
punto, a usar métodos numéricos o de aproximación. No obstante, si la densidad de
portadores en exceso op es mucho menor que la mayor de las dos cantidades (n 0 ,
p 0 ), D* y p* son substancialmente constantes y se pueden obtener fácilmente solu-
ciones analíticas para (10.2-26). Este estudio se restringirá al análisis de situaciones
en que se satisface esta condición y ésta se denominará el caso de nivel bajo.

4 Esta ecuación se parece a la de \:Ontinuidad para partículas que se difunden de un modo


mdependiente, que tendría la forma (10.2-13); pero no es exactamente la misma, ya que el
término E· \1p substituye a \1 ·(pE). Si el campo es constante, los términos son iguales; pero,
de otra manera, las ecuaciones y sus soluciones serán diferentes.
356 Exceso de portadores en semiconductores

Ahora se verá el caso de un material fuertemente extrínseco tipo n, en donde


n 0 >Po o 6p. Por ejemplo, supóngase que se tienen 10 15 electrones y 1011 huecos
por cm 3 en equilibrio. Se tendrá un tiempo de vida de electrones en equilibrio T no
y un tiempo de vida de huecos en equilibrio T po que estarán relacionados por
(10.2-2) ó (10.2-3). Es obvio que T po es mucho más pequeño (por un factor de
1O" en este caso) que T n 0 • Supóngase ahora que se crea una densidad uniforme de
pares electrón-hueco en exceso de tal modo que 6p = 6n = 10 11 cm- 3 • La caneen-
tracción de electrones ahora es n0 + 6n = 1.0001 x 10 15 cm- 3 , con un .incremento
del 0.01 por ciento sobre la densidad de equilibrio, en tanto que la concentración
de los huecos es 2 x 10 11 , que es el doble de la densidad de equilibrio. Puesto que
la densidad de electrones relativa a la densidad de equilibrio prácticamente no se altera
la probabilidad por unidad de tiempo de que un hueco dado se encontrará con un
electrón casi no varía tampoco. En consecuencia, el tiempo de vida del hueco no se
afecta y será prácticamente independiente de 6p para valores pequeños como estos
de 6p. Por otra parte, puesto que la densidad de los huecos se ha duplicado, la
probabilidad de que cualquier electrón dado se encuentre con un hueco se ha dupli-
cado también, y el tiempo de vida del electrón se reducirá más o menos a la mitad
de lo que era en el estado de equilibrio. De donde, el tiempo de vida de electrones
debe variar rápidamente con 6p aun a pesar de, que dicha cantidad sea muy pe-
queña. Evidentemente, la situación será justamente la opuesta en un material tipo p
sumamente extrínseco. En general, se observa que el tiempo de vida de los porta-
dores minoritarios es fundamentalmente independiente de 6p para valores pequeños
de 6p, en tanto que el tiempo de vida de los portadores mayoritarios no lo es. En
un semiconductor de fuerte tipo n, T P = r P para 6p <no, y el tiempo de vida de
los portadores en exceso r, como lo define (~0.2-29) se reduce a

(material de fuerte tipo-n) (10.2-30)

De la misma manera, para un cristal tipo p fuertemente extrínseco, se ve claramente


que ( 10.2-29) se reduce a

(matenat de fuerte tipo-p) (10.2-31)

Luego para el caso de nivel bajo, el tiempo de vida de los portadores en exceso T se
reduce simplemente al tiempo de vida de los portadores minoritarios. Los términos
tiempo de vida de portadores en exceso y tiempo de vida de portadores minoritarios
se usan con frecuencia indiferentemente, a pesar de que no siempre son iguales. En
especial, cuando las condiciones del caso de nivel bajo no se satisfacen o cuando el
cristal es casi intrínseco, el tiempo de vida de los portadores en exceso T difiere del
tiempo de vida de los portadores minoritarios. Este tiempo de vida de los portadores en
exceso es el que se mide casi siempre en los experimentos diseñados para detec-
tar la fotoconductividad de los portadores en exceso.
En las condiciones de nivel bajo, (1 0.2-27) y ( 10.2-28) muestran que en el caso
de un semiconductor tipo n fuertemente extrínseco, D* y p* se reducen a Dp y llp
y que, para un material tipo p fuertemente extrínseco, D* y p* se reducen a Dn Y
lln· Si se combinan estos resultados con los expresados en (10.2-30) y (10.2-31), se
puede escribir la siguiente expresión para las muestras extrínsecas tipo n

bp c(t5p)
D V 2(t5p)- p. E· V(bp)
P p
+ g ' -T Po
- = --
O(
(no~ p0 ,t5p) (10.2-32)
Comportamiento del transporte 3S7

y para muestras extrínsecas tipo p

(p 0 ~ n0 ,<5n). (10.2-33)

En cualquier caso, la concentración de la otra especie se obtiene de la relación


8p = 8n. Estas ecuaciones son muy parecidas a las de continuidad para el flujo de
portadores minoritarios. Los parámetros de transporte y recombinación, en todos los
casos, son los de los portadores minoritarios. A menudo se dice que en la situación
anterior, se escribe y resuelve la ecuación para los portadores minoritarios de flujo
de difusión, aunque esto no es cierto en realidad: las t::cuaciones (10.2-32) y (10.2-33)
además contienen una suposición implícita relacionada con el comportamiento de los
portadores mayoritarios.
En una muestra para la que n 0 y Po no son muy diferentes y en donde 8p es
mucho menor que el valor más pequeño de (n 0 , p 0 ), los coeficientes de transporte
ambipolar, (10.2-27) y (10.2-28), son constantes y se puede expresar como

D* =(no + Po)DnDp = (p~ + nf)DnDp


(10.2-34)
n 0 Dn + p0 DP nfDn + p~DP

(10.2-35)

El coeficiente de difusión ambipolar se acerca a Dp para p 0 ~ n¡ y a Dn para


p 0 ~ n¡. Para valores intermedios de Po, D* queda en algún punto entre estos dos
valores extremos. De igual manera, para p 0 ~ n¡, p.* tiende a Jl.p y, para p 0 ~ n¡, p.*
tiende a - P.n, quedando entre estos límites para valores intermedios de p 0 . Para un
material que es precisamente intrínseco, Po = n¡ y las ecuaciones anteriores se re-
ducen a

y p.~= o, (10.2-36)

de donde, la ecuación de continuidad (10.2-26) se convierte en

(10.2-37)

En realidad, para un material precisamente intrínseco, se observa en (10.2-27)


y ( 10.2-28), que esta es la ecuación de continuidad correcta para 8p sin importar lo
grande que sea 8p en comparación con n 0 o p 0 • De la misma manera, se puede ver
que esta ecuación de continuidad es aproximadamente correcta para los materiales
casi intrínsecos, siempre y cuando la densidad de portadores en exceso 8p tenga un
exceso muy notable en relación ecn h1 densidad de los portadores mayoritarios en
equilibrio, ya que en es'te caso, p.* se hace siempre muy pequeño. Como se verá en un
capítulo posterior, este hecho sunplifica enormemente el análisis de las estructuras
de dispositivos semiconductores en condiciones de corriente elevada. El hecho de
que p.* tienda a cero en muestras intrínsecas, no significa que los electrones y los
358 Exceso de portadores en semiconductores

huecos no adquieran una velocidad de arrastre cuando se aplica un campo eléctrico,


sino solamente que una distribución de la concentración de portadores en exceso no tiene
arrastre en estas circunstancias. Los electrones y los huecos entran y salen de una dis-
tribución semejante aunque la distribución propiamente dicha pueda permanecer esta-
cionaria o casi estacionaria.
Se debe tener cuidado de observar que el campo eléctrico E de las ecua-
ciones (10.2-26), (10.2-32) y (10.2-33), se relaciona con el campo eléctrico total como lo
defme (10.2-18), que incluye el campo interno originado por la difusión ambipolar y
el arrastre de las partículas cargadas del sistema. Se puede derivar una expresión
para este campo haciendo notar que la densidad total de la corriente eléctrica 1 se
puede escribir, con la ayuda de (10.2-8), (10.2-9) y (10.2-21}, como

1 = e(J,- Jn) = uE + e(Dn- D,)V(bp), (10.2-38)

en donde a es la conductividad según la da (9.7-5). Resolviendo para el campo,


utilizando las relaciones de Einstein para expresar las constantes de difusión en los
términos de las movilidades e introduciendo la relación de movilidad b, se puede obtener

1 kT b- 1
E = - - - -b-- V(bp) = Eap.+ E;n 1• (10.2-39)
q e n +p

El primer término anterior es el campo que se crea al aplicar una fuente de poten-
cial externo y el segundo representa el campo interno. Es evidente que el campo
interno, como se expresa en el segundo término, se desvanece cuando no existe un
gradiente de concentraCión de portadores y también, si las movilidades de huecos y
electrones son idénticas (b = 1). En el último caso, (10.2-27) y (10.2-28) dan D* =
D y p.*= [(n 0 - p 0 )/(n + p))p., en donde D y p. son el coeficiente de difusión de
huecos y electrones y la movilidad. Utilizando estos valores, se puede proceder a
resolver (10.2-26) usando para E el valor del campo aplicado y sin dar mayor interés
al campo interno.
Para materiales en los que las movilidades de los electrones y los huecos son
distintas, es evidente que el campo interno contribuirá al campo total E de
(10.2-26). Sin embargo, se verá que en la gran mayoría de los casos, se puede hacer caso
omiso de esta contribución. La razón es que, además de los efectos que se han
incorporado en los coeficientes de transporte modificados D* y p.*, el campo interno
ejerce ordinariamente sólo una pequeña influencia directa en la distribución espacial
de los portadores en exceso, en comparación con la de la difusión y los campos
aplicados. Esto se puede demostrar comparando las soluciones de (10.2-26) en donde
existe una difusión, pero no hay campo, y cuando se tiene un campo; pero esencial-
mente ninguna difusión. En el primer caso (suponiendo una geometría unidimen-
sional en la que 8p varía en la dirección x, en que la velocidad de generación
volumétrica en exceso g' es cero y que prevalecen las condiciones de estado esta-
cionario de tal modo que a(8p )jat = 0), la ecuación (1 0.2-26) se reduce a

(10.2-40)

Si sólo se buscan soluciones que tiendan a cero conforme x aumenta, se debe


escribir

(10.2-41)
Comportamiento del transporte 359

como la solución de (10.240). Por otro lado, si existe un campo constante E y si el


transporte de difusión puede omitirse, (10.2-26) se puede escribir aproximadamente
como

d(~p) ~p
(10.2-42)
dx = - p*E-r'
cuya solución es
(10.2-43)

De acuerdo con estas ecuaciones, es obvio que existe una longitud caracterís-
tica (D*r ) 1 / 2 asociada con el transporte puramente difusivo en el estado estaciona-
rio, y otra longitud característica p.*Er en este caso, en donde el efecto del campo
es predominante. Si el campo es cero, la segunda longitud será también cero. Queda
claro, de acuerdo con los resultados anteriores, que la distribución de portadores en
exceso resultante del transporte puramente difusivo, no se verá muy afectado por la
presencia de un campo eléctrico, a menos que dicho campo sea tan grande que
p*Er sea comparable en magnitud con la longitud característica de difusión
(D*r ) 1 / 2 . En otras palabras, si

ó (10.2-44)

entonces, el efecto del campo eléctrico en la distribución de la concentración de


portadores en exceso será despreciable. Al incluir los valores de D* y p.* de
(10.2-27) y ( 10.2-28) y el valor del campo interno dado en (10.2-39), en esta
expresión, se puede obtener como condición para el gradiente de concentración que

IV(~p)l ~ 1 (n + p)(nb + p) (10.2-45)


.JD*t (b - 1)(no - Po)

para que el efecto del campo interno pueda omitirse en (10.2-26). En la práctica se
puede proceder inicialmente omitiendo el campo interno y calculando rrp a partir de
(10.2-26), utilizando el campo aplicado en el lugar de E. El gradiente de op se
calcula entonces basándose en la solución resultante y se comprueba con (10.245)
para asegurarse que la solución satisfaga esta condición en todos los puntos dentro
de la región de interés. Si se violara (10.245), la solución tendría que rechazarse y
sería necesario elaborar un nuevo cálculo en el que se incorporara el campo interno
desde el principio. En sistemas puramente difusivos, se verá que la solución tiene a
menudo la forma op = (const) e-xfL en donde L es aproximadamente (si no con
precisión) igual a (D*r ) 1 12 • En tales casos, el gradiente de op está dado por - opfL.
Se ve claramente en la forma de ( 10.245), que la condición que expresa esta
ecuación nunca se viola seriamente, sean cuales fueran los valores que puedan tener
n 0 , p 0 , op y b. Se pueden obtener valores mayores de V(~p) si hay un campo
aplicado presente; pero en estas circunstancias, aunque la condición ( 10.245) ya no
se satisfaga, se encontrará por lo general que el campo interno que se genera ahora
es pequeño, en comparación con el campo aplicado que se requiere para mantener
este estado. De donde, se puede llegar a la conclusión de que generalmente es buena
aproximación considerar que el campo E de la ecuación (10.2-26) es el campo
aplicado, sólo haciendo caso omiso del efecto explícito del campo interno. No obs-
tante, se debe notar que el efecto del campo interno está implícitamente compren-
dido en los coeficientes de transporte modificados D* y p*.
360 Exceso de portadores en semiconductores

Las ecuaciones de continuidad (10.2-16) y (10.2-17) conducen directamente a


la ecuación diferencial ( 10.2-26) para fJp, cuando se hace la suposición de la neu-
tralidad eléctrica. Cuando una expresión de fJp se ha obtenido como solución a
(10.2-26), la validez de la suposición de neutralidad eléctrica se puede corroborar
fácilmente computando la desviación de la neutralidad de carga para producir el
campo interno dado por ( 10.2-39) y comparando la diferencia en las densidades de
carga obtenidas de esta manera, con la densidad total de portadores excedentes que
se obtuvo en la solución (Hl.2-26). Usando (9.5-12), se puede escribir la ecuación
de Poisson (10.2-19) en función de las densidades de exceso fJn y fJp; si se usa
(10.2-20) y (10.2-39) para expresar el campo eléctrico, se obtiene

V. E. = 4ne(bp- bn) = kT ~ V 2 (bp). (10.2-46)


IRI K e nb +p
La razón de la diferencia de densidades fJp - fJn requerida para establecer el
campo interno a una densidad real, fJp se puede escribir como sigue

(10.2-47)

La expresión del lado derecho de esta ecuación debe ser mucho menor que la
unidad para que sea válida la suposición del balance de carga ( 10.2-21 ). Esta condi-
ción se puede expresar de un modo algo diferente m•lltiplicando el numerador y el
denominador anteriores por n¡. Por tanto, la condición para la validez de la suposi-
ción del balance de carga se convierte en

lbp-bponl = L
~-=---
2 (b- l)ni V 2(8p) 1
D, nb + p
-- ~
op
(10.2-48)

en donde

(10.2-49)

¡:s un parámetro con las dimensiones de longitud, que se conoce como "longitud
intrísenca de Debye" asociada con el material. A 300°K, la longitud intrínseca de
Debye es aproximadamente 34¡.t para el silicio y 0.96¡.t para el germanio. Si, como
sucede con mucha frecuencia, la densidad de concentración en exceso tiene la forma
fJp = (const)e±xJL en donde L es una distancia característica de decaimiento que en
sistemas puramente difusivos tiene el valor (D*T) 1 12 , entonces, V2(f>p)fop = 1fL2 y
(10.243) se puede expresar como

bp - bnl = L~, (b - l)n; ~ l. (10.2-50)


bp L2 nb +p
'
Esto deja en claro que la suposición de la neutralidad eléctrica debe ser acepta-
ble cuando la distancia característica L es mucho mayor que la longitud intrínseca de
Debye y cuando nb + p es mucho mayor que (b - l),li' Estas condiciones se satisfa-
cen casi siempre en muestras intrínsecas o extrínsecas de silicio y germanio, a menos
que el tiempo medio de vida de los portadores en exceso, T, sea extremadamente
Algunas soluciones particulares de la ecuación de continuidad 361

corto. En los semiconductores compuestos de tipo III-V, como inSb y GaAs, los
tiempos de vida de los portadores, por lo general son muy cortos; para estos mate-
riales, la condición (10.2-50) se satisface con frecuencia, aunque no siempre. Las
substancias semiaisladoras en las que nb + p, al igual que L pueden ser muy peque-
ñas, la condición ( 10.2-50) se viola la mayor parte de las veces y es necesario aplicar
otros métodos para analizar los problemas de los portadores agregados. En conse-
cuencia, la situación es por lo general muy compleja, aunque Roosbroeck 5 desarrolló
una teoría muy general para el análisis de problemas de esta índole. Puesto que la
suposición del balance de carga es válida para la gran mayoria de los casos relaciona-
dos con los materiales semiconductores más conocidos, no se tomarán en cuenta
explícitamente las situaciones en que se viola.

10.3 ALGUNAS SOLUCIONES PARTICULARES


DE LA ECUACION DE CONTINUIDAD

A continuación convendrá examinar la forma que adquiere la solución de la


ecuación de continuidad en ciertos casos especialmente sencillos e importantes. En
primer lugar, se examinará lo que sucede en un cristal uniforme muy grande cuyas
fronteras, para fines prácticos, pueden suponerse en el infinito, en cuyo caso no se
tiene un campo aplicado ni una generación volumétrica de los pares electrón-hueco
en exceso. En el tiempo t = O se supondrá que de alguna manera se ha creado una
distribución espacial uniforme de densidad de portadores excedentes. En estas circuns-
tancias V (op) = V 2 (lJp) =O, y, dado que el efecto de difusión es siempre reducir
más que crear gradientes de concentración, estas cantidades seguirán siendo cero en
todos los tiempos posteriores. En consecuencia, la ecuación (1 0.2-26) toma la formd

d(Jp) Jp
----¡¡-= -"7. (10.3-l)

Si T es independiente de op, esto se puede resolver fácilmente y se obtiene


Jp = p- Po= Ae-rtr (10.3-2)

en donde A es una constante arbitraria que aquí es igual al valor de op en t = O. En


este caso, la densidad de portadores en exceso se pierde en todos los puntos de un
modo exponencial en función de una constante de tiempo T igual al tiempo de vida
de los portadores en exceso.
Otro caso de gran importancia es la solución de estado estacionario para una
muestra infinita en la que los portadores en exceso se crean a través de una fuente
uniforme plana de generación que, para mayor facilidad, se supondrá que coincide
con el plano yz. En este caso tampoco se tiene un campo aplicado o cualquier
generación de portadores en exceso en la muestra. En estas condiciones, la densidad
de portadores en exceso variará sólo a lo largo de la dirección x. Para simplificar las
cosas, se estudiará el caso de una muestra tipo n fuertemente extrínseca en la que la
densidad de portadores en exceso, en todas partes es mucho menor que la concen-
tración de los portadores mayoritarios. En estas circunstancias, los coeficientes de
transporte D*, JJ*, y T se reducen a los coeficientes constantes Dp, Jl.p y T P relacionados
con los portadores minoritarios, y (10.2-26) se convierte en
s W. van Roosbroeck, Phys. Rev., 123 474 (1961).
362 Exceso de portadores en semiconductores

{10.3-3)

en donde

LP = JDPtP. {10.3-4)

Las soluciones de {10.3-3) deben tener en todas partes la forma general

op = p(x)- Po= Ae"/Lp + Be-x/Lp (10.3-5)

en donde A y B son constantes arbitrarias. Puesto que existe una fuente plana de
portadores ubicada en x =O en el plano yz, se tendrá cierto tipo de singularidad en
la solución en este punto, y es mejor considerar la solución de 8p en la regiór.
x <O (que se denominará 8p_(x)), y la solución en la región x >O {que se llamará
8p+(x)) independientemente. Por tanto, de acuerdo con esto y con (10.3-5), éstas
deben tener la forma

(x >0) {10.3-6)
y
op_(x) = p_(x)- Po= A_ex/Lp + B_e-x/Lp (x < 0). (10.3-7)

Puesto que existe una velocidad de recombinación volumétrica diferente a cero.


las densidades de los portadores en exceso debe tender a cero al alejarse de la
fuente. Estas condiciones de frontera requieren que A+= B_ =O. Además, de acuer-
do con la simetría geométrica de la situación, es evidente que 8p(x) debe ser una
función par de x, por lo cual, A_= B+ = A 0 y
op+(x) = P+(x)- Po = A 0 e-xfLp (x > 0) (10.3-8)

op_(x) = p_(x)- Po = Aoe"/Lp (x < 0). (10.3-9)

La concentración de electrones en exceso, de acuerdo con (10.2-21), es igual a la


concentración de huecos en exceso. En la figura 10.4 se muestran los perfiles de con-
centración resultantes. La concentración de portadores en exceso se pierde expo-
nencialmente en ambos lados de la fuente, plana con una distancia característica de
decaimiento de Lp.
La corriente de difusión de los portadores minoritarios asociada con la distribu-
ción de portadores en exceso, se puede calcular a partir de {10.2-8) y es

J (x) = -D d(op+) = AoDp e-x/Lp (x > O) (10.3-10)


p+ P dx Lp

J (x) = -D d(op_) = - AoDp e"'Lp (x < 0).


p- P dx L (10.3-11)
p

Conforme x tiende a cero a través de valores positivos, Jp+ se acerca a AoDp(Lp, en


tanto que conforme x se acerca a cero a través de valores negativos, Jp- tiende a
Algunas soluciones particulares de lo ecuación de continuidad 363

-x

Figura 10.4. Concentraciones de electrones y huecos en estado estacionario dentro de un cristal


infinito en el que existe, en x =O, una fuente plana para la generación de porta-
dores en exceso.

-AoDp/Lp. La diferencia entre estas cantidades es el flujo total de la fuente o el


número de portadores minoritarios por cm 2 por segundo, emitidos por la fuente. En
otras palabras,

(10.3-12)

en donde F 0 es el flujo de la fuente. Esta ecuación permite expresar el coeficiente


A 0 de ( 10.3-8) y ( 10.3-9) en términos del flujo F 0 cuando la fuente se describe en
función del flujo inicial emitido. Para una muestra que no es fuertemente extrínseca,
sino en la qae la densidad de portadores en exceso, en todos sus puntos es lo
suti.cientemente pequeña, las soluciones a (10.3-8) y (10.3-9) por supuesto son co-
rrectas todavía a condición de que Lp se substituya por medio deL*= (D*r) 1 12 •
Para comprender la naturaleza física del transporte ambipolar, conviene exami-
nar en detalle los flujos de electrones .y huecos. que estan presentes en esta muestra
en particular. Con este fin se verá una muestra en la que la densidad de equilibrio
de los portadores es arbitraria, en lugar de ver un material extrínseco tipo n. En
general, habrá flujos de huecos y electrones que se originan de la difusión y, al
mismo tiempo, flujos de las dos especies de portadores, que se deben a la presencia
del campo interno como lo da (10.2-39). Si se observa que en la región
(x >O) op+ = A 0 e-xfL •, de donde, d(op+)fdx = - op+fL*, y utilizando las rela-
ciones de Einstein (10.2-11), los flujos de huecos y electrones debidos a la difusión
se pueden escribir como sigue

d dp+ d(()p+) p.,kT ()p+


J =-D-=-D--=---- (10.3-13)
p+ P dx P dx e L*
y

Jd = -D dn+ = -D d(()p+) = P.nkT ()p+


(10.3-14)
n+ " dx " dx· e L* .
Los flujos de huecos y electrones que se crean debido al campo interno (10.2-39)
son

(10.3-15)
364 Exceso de portadores en semiconductores

(10.3-1~

Los flujos totales de electrones y huecos se pueden encontrar ahora sumando la


componentes de la difusión y el campo interno. El resultado es
Jl.pkT b(n+ + P+) ~P+ {10.3-17)
Jp+ =Jn+ = - -
e n+
b
+ P+ r* •
LJ

De acuerdo con estas ecuaciones, la fracción del flujo total de las dos especies
de portadores que se debe a la difusión y a la presencia del campo interno se
puede calcular con suma facilidad. Se encontrará que

J~+ n+b + P+ J~+ n+b + P+


-=
Jp+ = b(n+ + P+) Jn+ n+ + P+ {10.3-18)

J~+ P+(b- 1)
Jp+ = b(n+ + P+)
Es muy interesante examinar estas expresiones en los tres casos específicos:
materiales extrínsecos tipo n, en donde n+ ~ P+, materiales extrínsecos tipo p, en
donde P+ ~ n+ y el material intrínseco, en donde n+ = P+· En estos tres casos, las
ecuaciones (10.2-18) se convierten en
intrínseco (n+ = P+)

1. b+l
' 2b

1 b-l
O; 1--.
b' 2b

(10.3-19)
1. b+l
b;
' 2

l-b
1- b; o·' 2

De acuerdo con estos resultados, es obvio que en las muestras extrínsecas, el


flujo de portadores minoritarios debidos al campo interno es insignificante en compa-
ración con el flujo de difusión. Sin embargo, el flujo de portadores mayoritarios
debido al campo es importante. En efecto, este flujo debe ser tan grande que
asegure la casi neutralidad en todos los puntos. Por tanto, debe compensar el dese-
quilibrio entre los flujos de difusión de portadores minoritarios y los mayoritarios
originados por la desigualdad de los coeficientes de difusión de los electrones y los
huecos. Esta situación se puede comprender mejor observando en (10.2-39) que, en
muestras extrínsecas, la magnitud del campo externo se hace muy pequeña debido al
factor nb+P del denominador que se hace muy grande en muestras extrínsecas. No
Algunas soluciones particulares de la ecUJJción de continuidad 365

obstante, el flujo de portadores mayoritarios que se produce debido al campo in-


terno sigue siendo apreciable, ya que es proporcional al producto del campo interno
muy pequefio y la gran densidad de portadores mayoritarios. Por supuesto, el flujo
de portadores minoritarios debido al campo interno es extremadamente pequefio,
puesto que tanto el campo interno como la densidad de portadores minoritarios son
pequefios. Por otra parte, los flujos de difusión de los portadores mayoritarios y
minoritarios dependen sólo de los gradientes de concentración y los coeficientes de
difusión inherentes, tanto de electrones como de huecos, y, puesto que los gra-
dientes de concentración de electrones y huecos son los mismos, deben ser comparables
en magnitud y difieren sólo en una cantidad proporcional a la diferencia entre las
difusibilidades inherentes de los dos portadores.
El estudio de esta situación puede llevar a explicar por qué en las muestras
extrínsecas, el coeficiente de difusión ambipolar es el coeficiente inherente de difu-
sión de los portadores minoritarios. En estas condiciones, el campo interno es pe-
quefio y puede crear flujos relativamente grandes de portadores mayoritarios; pero
se desecha su influencia en el flujo de portadores minoritarios. En consecuencia, el
flujo de portadores minoritarios se debe exclusivamente a la difusión de los porta-
dores minoritarios y en esencia no se lo afecta el campo interno. El flujo de
portadores minoritarios observado, por ende es el que producen independientemente
los portadores minoritarios en difusión. Para que se satisfaga la situación de casi
neutralidad, el flujo de portadores mayoritarios debe ser el mismo. Parte de este
flujo se debe a la difusión de los portadores mayoritarios; pero, puesto que las
difusibilidades inherentes de las dos especies de portadores son desiguales, se tendrá
un déficit (o exceso) inevitable. Este déficit o exceso puede deberse al flujo de
portadores mayoritarios cuya fuente es el campo interno. El efecto neto es que los
flujos de electrones y huecos son iguales entre sí y al flujo que produciría una
distribución de portadores minoritarios difundiéndose imdependientemente; es así co-
mo se relaciona el -::oeficiente de difusión de la distribución de portadores en exceso
con los portadores minoritarios. Por tanto, en sistemas extrínsecos casi siempre se
requiere considerar explícitamente sólo el comportamiento de los portadores minorita-
rios. Por supuesto, en muestras que son intrínsecas o casi intrínsecas, es importante
el efecto del campo interno en los dos tipos de portadores. Este caso se ilustra en la
expresión (10.3-19) y a través de la dependencia de los coeficientes de transporte
ambipolar en relación con la difusibilidad o movilidad de electrones y huecos. Aun-
que estos resultados se vieron en conexión con una muestra específica más restringida,
es evidente que los principios físicos implícitos son los mismos en todos los sistemas
y que las conclusiones obtenidas tienen una aplicación general.
Ahora se puede constatar que los flujos de difusión de los portadores minorita-
rios (10.3-10) y (10.3-11) son los flujos totales de los portadores minoritarios en el
caso de una muestra extrínseca tipo n. En un cristal que no es extrínseco, los flujos
totales de electrones y huecos se pueden obtener de (10.3-17), escribiendo b = JJ.n/JJ.p
y usando las relaciones de Einstein, en la forma

(10.3-20)

Por supuesto, dado que en esta muestra no se tiene un campo aplicado, la corriente
eléctrica total 1 = e(JP + - J n +) es cero.
A continuación se estudiará la extensión de la solución precedente para el caso
en que existe un campo constante aplicado E 0 en la dirección positiva n. La ecua-
ción diferencial (10.2-26) se puede escribir para el material extrínseco tipo n como
366 Exceso de portadores en semiconductores

d_2 (bp)
_2_ _ f.1pEo
___ d(bp)
_ _ _bp
__ _ 0 o
(10.3-21'
dx DP dx LP

Esta ecuacton se puede resolver utilizando las técnicas normales aplicables ¡


ecuaciones diferenciales lineales con coeficientes constantes, lo que da

i5p(x) = p(x)- Po= AeYp+xfLp + BeYp-x/Lp (10.3-22)

en donde

(10.3-23,

(10.3-24)

Esta solución es la misma que (1 0.3-5) excepto que los argumentos de lO!i
factores exponenciales se multiphcan por los factores 'Yp+ Y - 'Yp-, que depender;
del campo eléctrico. De acuerdo con la definición dada antes, se ve claramente que.
sea cual fuere el valor que pueda tener E 0 , 'Yp+ debe ser siempre positivo, mientras
que 'Yp- debe ser siempre negativo; cuando 'Yp+ y 'Yp- se grafican en función del
campo, las dos cantidades se representan por medio de dos ramas de una hipérbola_
como se ilustra en la figura 10.5. Para 'YP = O, a un campo cero, ( 10.3-14) se reduce

f (Yp)

-3

Figura 10.5. Gráfica de las funciones 'Yp+ y 'Yp-·

a la ecuación de la sección anterior. Para valores positivos grandes de 'Yp (y, por
ende, para campos tales que E 0 ;p 2kTfeLp), se puede demostrar con la ayuda de la
expansión binómica y (10.24) que

LP
--= ---- (10.3-25)

mientras que es obvio que, en estas circunstancias,

(10.3-26)
Algunas soluciones particulares de la ecuación de continuidad 367

Se puede ver claramente en (10.3-15) que 'Yp+ y 'Yp- están relacionados


siempre por medio de

'l'p+'l'p- =-l. (10.3-27)

Ahora se puede repetir el desarrollo del caso del campo cero que se da en las
ecuaciones (10.3-6) (10.3-12), suponiendo, como antes, que hay dos expresiones
separadas para l>p+(x) en la región x >O y l>p_ (x) en la región x <O, con los
coeficientes A+, B+, A_ y B_, y demostrando en Ia misma forma que A+ y B_
deben tomarse como cero para asegurar el comportamiento apropiado en ± oo. El
resultado se puede escribir como sigue

(x > O) (10.3-28)

(x < O) (10.3-29)

en donde A 0 es una constante arbitraria que expresa la intensidad de la fuente de


generación. La concentración de electrones en exceso será igual a la concentración
de huecos en exceso. En la figura 10.6 se ilustran los perfl.les de concentración para
un valor positivo de E 0 . Puesto que las características de transporte de la distribu-
ción de portadores en exceso son prácticamente las de los portadores minoritarios,
tenemos que el transporte de los portadores en exceso hacia la derecha (en dirección
del movimiento de los huecos bajo un campo aplicado) se ve favorecido por la
acción del campo, en tanto que se retrasa el transporte de portadores en dirección
opuesta. De acuerdo con ( 10.3-25), se puede verificar que (1 0.3-28) tiende al resul-
tado que se obtuvo antes, (10.2-43), para campos grandes aplicados, como sería de
esperarse. Al igual que antes, los flujos de partículas portadoras minoritarias Jp+(x)
y Jp_(x) pueden calcularse a partir de (10.2-8); las contribuciones se obtienen
ahora tanto del término de difusión como del término del campo eléctrico. Parte del
flujo de partículas resultante se deberá al arrastre de los huecos que están presentes
en equilibrio térmico cuando, el campo está aplicado, y otra se deberá a la difusión

p(x), n(x)

--- --------~

--------------
Figura 10.6. Concentraciones de electrones y huecos en un estado estacionario, dentro de un
cristal en el que existe, en x =O, una fuente plana de portadores en exceso y estando
presente un campo eléctrico constante en la dirección x.
368 Exceso de portadores en semiconductores

y al arrastre de la distribución de portadores en exceso. El flujo producido por este


último efecto, evaluado en el plano de la fuente, es

(10.3-30}

Esta ecuac10n es análoga a (10.3-12), que relaciona al coeficiente de amplitud Ao


con el número total de portadores por unidad de área por unidad d~ tiempo, Fop.
generados en el plano de la fuente. Cuando la muestra no es fuertemente extrínseca
y cuando la densidad de los portadores agregados es lo suficientemente pequefia, las
soluciones anteriores seguirán siendo válidas a condición de que Dp, JJ.p, Lp y r P se
substituyan respectivamente por D*, JJ.*, L * y r.
Las mismas observaciones que se hicieron sobre la relación de los flujos debi-
dos a la difusión y a los campos internos en conexión con el caso libre de campo.
también se aplican en esta situación; por ejemplo, en una muestra extrínseca, el
flujo de portadores minoritarios producido por el campo interno es despreciable en
comparación con el flujo de difusión correspondiente, mientras que los flujos de los
portadores mayoritarios atribuibles a cualquiera de las dos fuentes tienen una magni-
tud comparable. Sin embargo, ahora se cuenta además con flujos grandes de los dos
tipos de portadores, comprendiendo tanto a los portadores en exceso como a los de
equilibrio, debido al campo aplicado. Estos flujos se superponen a los flujos produ-
cidos por la difusión y los campos internos; como resultado, la densidad total de la
corriente eléctrica ya no se desvanece, sino que por el contrario se representa por
medio de aEapl· En relación a esto, se debe observar que el ejemplo que se está
estudiando comprende sólo una situación en la que 8p es, en todos sus puntos,
mucho menor que la densidad de portadores mayoritarios en equilibrio. Puesto que
la densidad total de corriente eléctrica debe ser la misma en todas partes, una
situación en la que Dp es lo suficientemente grande para modular apreciablemente la
conductividad, implicaría un campo que no puede ser constante; pero que es grande
cuando Dp es pequeño y viceversa. Para valores pequeños de Dp, subsiste la misma
dificultad, pero las variaciones correspondientes del campo son tan pequeñas que el
planteamiento del campo constante constituye una aproximación aceptable. Por su-
puesto, existen muchas otras dificultades que se presentan cuando [)p se hace com-
parable a la densidad de portadores en equilibrio.
Como ejemplo final, se verá un sistema uniforme unidimensional en el que se
generan simultáneamente N pares de electrón-hueco en un punto x = x' al tiempo
t = t'. Se supondrá que la muestra se extiende al infinito en ambas direcciones a lo largo
de eje x y que se aplica un campo eléctrico constante E 0 . Por tanto, para una
muestra extrínseca tipo n, la ecuación ( 10.2-26) se convierte en

(10.3-31)

Una solución de esta ecuacwn, válida para todos los valores t > t' que satisfaga
todos los requisitos del problema es

_( )_
op x,t - _
t- t']
N _ __ exp [ - {(x- x')- JJ.pE 0 (t- t')} 2 - - - .
(10.3-32)
../4rrDp(t- t') 4Dp(t- t') <p
Algunas soluciones particulares de la ecuación de continuidad 369

El hecho de que (10.3-32) satisface la ecuación diferencial (10.3-31), se puede esta-


blecer por substitución directa. 6 Se puede demostrar fácilmente que el valor inicial
op(x, O) es cero en todos los puntos excepto cuando x = x', punto en el que se hace
infmito. La distribución inicial de concentración, entonces corresponde a una función
o de Dirac. Para tiempos posteriores, la distribución tiene una forma gaussiana,
cuya anchura media aumenta con respecto al tiempo y cuya amplitud máxima decrece
con relación al tiempo. El punto de concentración máxima se desplaza también a lo
largo de la dirección del campo, a una velocidad JJ.pEo. La expresión (10.3-32) se puede
integrar sobre x entre los límites - oo y + oo (haciendo que u= (x- x')- JJ.pE 0 (t- t'),
de donde, du = dx, y t se considera constante) para obten~r el número total de huecos
en exceso oP en la distribución como una función del tiempo. El resultado es

i5P(t) = J~oo bp(x,t) dt =Ne -(1-t')/rp. (10.3-33)

Por tanto, el número total de portadores, que es N originalmente, desciende de


un modo exponencial con la .::onstante de tiempo T P, como podría esperarse. En la
figura 10.7 se ilustra el comportamiento de la concentración de portadores en exceso
en función de x y t.

8P (x,t) 8P(x,t)
t=O
t=O

-x -X

(al (b)

Figura 1O. 7. (a) Dispersión difusiva de portadores en exceso inyectados inicialmente como una
distribución o
en x =O, sin tener un campo eléctrico aplicado. (b) Dispersión
difusiva Y arrastre de la distribución en (a) aplicando un campo eléctrico cons-
tante en la dirección x. En ambos casos O <t 1 <t2 <t3 <t4 .

Si ahora se revisa la definición de N, la intensidad inicial de la fuente, toman-


do a N(x', t') dx' d t' como el número de huecos o electrones en exceso generados
en un intervalo d t' alrededor de t = t', dentro del elemento de espacio dx alrededor
de x = x', entonces, la concentración subsecuente debida a este elemento de genera-
ción en función de x y t se obtendrá substituyendo N de (10.3-32) con N(x',
t') dx' dt'; la distribución de concentración resultante debe marcarse como una fun-
ción de x' y t', al igual que de x y t, es decir, se debe escribir como sigue:

6 La solución de (10.3-32) se puede obtener por medio de las técnicas de transformación


de Laplace o por la integral de Fourier.
370 Exceso de portadores en semiconductores

óp(x,t;x',t'). La concentración óp(x,t) que se ongma de una distribución arbitraria


conocida de generación cuya intensidad puede variar con las coordenadas del espacio
y el tiempo x', y t' se puede calcular superponiendo soluciones de esta forma, cada
una de las cuales se caracteriza por la intensidad de generación local N(x', t') dx' dt'.
Esta superposición de elementos infinitesimales, cada uno con su propia intensidad
de fuente local, lleva a una integral sobre dx' y dt' de la forma

bp(x,t) = I r foo
-oo -oo
N(x',t')
.j4nDp(t- t')
[ {(x - x')- J1 E 0 (t- t')} 2
exp - P
4Dp(t- t')
-
t - t']
--
rP
, ,
dx dt .

(1 0.3-34)

Por supuesto, la integral se desarrolla sólo hasta t' = t, debido a que la genera-
ción futura no contribuye a la concentración observada al tiempo t. Naturalmente, la
solución anterior se aplica sólo a una muestra infmita en que la distribución de
concentración satisface la condición de frontera de que la concentración debe tender
a cero lejos de la fuente. Para muestras finitas, primero se deberá encontrar una
solución para una función ó de distribución de fuente inicial, por ejemplo, (10.3-32):
pero satisfaciendo además las condiciones de frontera apropiadas en las superficies de
la muestra. 7 Entonces se podría usar el mismo procedimiento de superposición para
obtener la solución de una distribución arbitraria de ~eneración con respecto a las
coordenadas del espacio y el tiempo para muestras de esta clase.
Este procedimiento se puede generalizar con cierta facilidad a sistemas tridi-
mensionales. La solución para una generación instantánea de N(r', t') dv' dt' dentro
del elemento de volumen dv' alrededor del punto r = r' al tiempo t = t', descri-
biendo la distribución de concentración subsecuente que se origina de este elemento
de generación inicial dentro de una muestra infmita, es

. , , _ N(r',t') du'dt' ex [- {(r- r')- J1pE 0 (t- t')} 2 _ t- t']


bp(r,t,r,t)-[4nDp(t-t')]f p 4Dp(t-t') rP · (10.3-351

En este caso se puede verificar también que (10.3-35) es una solución para la
ecuación tridimensional de difusión correspondiente a {10.3-31) por medio de una subs-
titución directa. La superposición de soluciones de la forma (10.3-35) ahora se puede
hacer en la misma forma que antes, dando como resultado una integral sobre la distri-
bución de la fuente de generación de la forma

.
op(x,t) =
J'-oc
f N(r',t')
v[4nDP(t-t)]
[ {(r- r')- J1pE 0 (t- t')} 2 t- t'] 'd,
, t exp -
4Dp(t-t)
, - - - dv t .
rP

Se descubrirá que casi todas las soluciones particulares de la ecuación de con-


tinuidad que se han descrito en esta sección, son útiles para estudiar trabajos experi-
mentales relacionados con distribuciones de portadores en exceso o estructuras de
dispositivos semiconductores de importancia tecnológica.

7 Por lo general, la solución para una distribución inicial de fuente de una función ó se
cita como la función de Creen apropiada para un sistema dado y un conjunto particular de
condiciones de frontera.
Movilidad de arrastre y el experimento de Haynes-Shockley 371

10.4 MOVILIDAD DE ARRASTRE Y EL EXPERIMENTO


DE HAYNES-SHOCKLEY

El experimento de Haynes-Shockley se realizó originalmente para medir con


precisión y de un modo directo, la movilidad de arrastre de huecos y electrones en
cristales semiconductores. 8 Aunque tiene un gran interés debido a que fue la primera
medición directa 9 de la velocidad de arrastre de los portadores de carga, que se
realizó con verdadero éxito, también es muy instructivo para dilucidar el comporta-
miento de transporte de electrones y huecos en exceso en semiconductores, y tam-
bién para demostrar las características básicas del funcionamiento del transistor, ya
que el circuito Haynes-Shockley es, en efecto, un tipo de transistor.

+o-+-------. - ,,,,1-+----. Señal Sincro·


Generador Batería
de pulsos del colector

.-+--+-o Osciloscopio
~~~~~~~~~----,~~~,~~~~

1 1
x=O x=d

L...---'llfl'.~-----1+ 1111111-------1
Batería
de barrido
Figura 10.8. Diagrama esquemático del experimento de Haynes-Shockley.

Como se ilustra en la figura 10.8, en el experimento de Haynes-Shockley se


inyecta un exceso de portadores minoritarios al cristal y se recogen de éste mediante
un contacto de puntas de prueba metálicas. Aunque se debe posponer una descrip·
ción detallada de lo que sucede en un contacto rectificador de puntas de metal, en
la figura 10.9 se capta una idea general de su comportamiento. En esta ilustración se
describe una muestra de semiconductor en el que se ha establecido un contacto de
puntas de prueba y se ha formado una gran zona de contacto. El área grande de contacto,
que se puede haber fabricado apropiadamente por soldadura, una región de aleación
o por un contacto a presión, actúa como un contacto óhmico de la muestra y no
afecta considerablemente a la distribución de portadores en la muestra. Sin embargo,
la punta de prueba actúa como un contacto rectificador; cuando se polariza de tal manera
que atraiga hacia ella a los portadores minoritarios, actuará como un colector de porta-
dores minoritarios vaciando la región del cristal adyacente a ella de estos portadores,
hasta que se llega a un estado estacionario en que los portadores minoritarios se
difunden desde el interior del cristal con la suficiente rapidez para satisfacer el
déficit causado por su desaparición en las puntas de prueba. En estas condiciones

8J. R. Haynes y W. Shockley, Phys. Rev., 81, 835 (1951).


9En contraste con el efecto de Hall que sólo admite la determinación indirecta de la
movilidad.
372 Exceso de portadores en semiconductores

--+---
+----- +
=n-type =

Colecta huecos Inyecta huecos Colecta electrones 1nyecta electrones


corriente pequeña corriente grande corriente pequeña corriente grande
(o) (b) (e) (d)

1 1

==;;;:¡;of---v
DiaQramas de
cornente·voltaje
tipo·n tipa-p
(e) ( f)

Figura 10.9. Rectificador semiconductor con contactos de puntas (a) tipo n. con polarización
inversa, (b) tipo n con polarización directa, (e) tipo p con polarización inversa, (d)
tipo p con polarización directa, (e) característica corriente-voltaje del rectificador tipo
p de contacto de puntas.

(que se conoce como polarización inversa), esta corriente de portadores minoritarios


es la única que puede fluir por la punta de prueba y, puesto que es muy pequeño
el abastecimiento de portadores minoritarios del cristal, el flujo de la corriente se
reduce mucho y es relativamente independiente del voltaje de polarización, ya que al
suministro de portadores minoritarios no le afecta el cambio del voltaje de polariza.
ción inversa. Esta situación se ilustra en la figura 10.9(a) y (e) para materialeJ
semiconductores tipo n y p. Cuando el voltaje de polarización se invierte para atraer
a portadores mayoritarios a la punta de prueba, se encuentra que, además del flujo
de éstos hacia ella, se inyecta un exceso de portadores minoritarios a la muestra en
el contacto de puntas. En esta forma de operación, la corriente fluye con facilidad y
se pueden alcanzar flujos de corriente relativamente grandes con pequeños voltajes de
polarización. Se ha encontrado que la corriente aumenta de un modo más o menos
exponencial conforme se incrementa el voltaje de polarización, y no es difícil produ-
cir un número suficiente de portadores inyectados para modular con gran fuerza la
conductividad del semiconductor. 10 En la figura 10.9(b) y (d) se muestra el caso
de esta polarización directa. Las relaciones corriente-voltaje para cristales tipo n y
tipo p se ilustran en el mismo conjunto de diagramas en (e) y (f), respectivamente. El
efecto de rectificación por contacto de puntas, como se presenta en (e) y (f), en efecto
proporciona una prueba muy sencilla para distinguir los cristales semiconductores tipo n
de los tipo p.

lO Debe recordarse que un exceso de concentración de los portadores mayoritarios siem-


pre debe ir acompañado de una distribución de portadores minoritarios en exceso. Los porta-
dores mayoritarios necesarios para conservar la neutralidad eléctrica abundan en el volumen dd
cristal de donde se extraen atraídos mientras se forma la distribución de portadores minoritarios
en exceso. Cualquier déficit resultante en la concentración de portadores mayoritarios en d
volumen se contrarresta inmediatamente con los portadores mayoritarios obtenidos por el con-
tacto metálico óhmico.
Movilidad de arrastre y el experimento de Haynes-Shockley 373

En el experimento de Haynes-Shockley se inyectan portadores minoritarios en


el emisor e de la f:tgura 10.8. La muestra tiene la forma de una barra larga y delgada, y se
establece un campo eléctrico mediante una batería externa que, por supuesto, hace que
fluya una corriente ls por la muestra. Este campo eléctrico barre los portadores minorita-
rios inyectados dentro de la muestra, pasando por un segundo electrodo ubicado a una
distancia conocida d del primero, que se polariza de un modo inverso, de tal manera que
actúa como colector de portadores minoritarios. Cuando no se tienen portadores en ex-
ceso en el colector, la única corriente que fluye en dicho electrodo es una pequefia co-
rriente de saturación que se debe a la recolección de portadores minoritarios de equilibrio
que realiza la punta de pruebas. Conforme la distribución de portadores minoritarios
inyectados pasa por el colector, la concentración de éstos en su cercanía va en
aumento y el número de ellos que se recoge allí por unidad de tiempo asciende
proporcionalmente. Si el trazo del osciloscopio se inicia en el momento en que se
inyecta originalmente el impulso de portadores, no se observará nada en la pantalla
hasta que la distribución de portadores en exceso haya llegado al colector, tiempo
en el que la corriente de colector se incrementará y se observará un impulso de
sefial en el osciloscopio.
Puesto que la concentración de portadores en exceso es una función de la
distancia x en la dirección de la muestra, es básicamente la que se da en (10.3-32) y
que se ilustra de un modo gráfico en la figura 10.7(b), es evidente que el máximo
de la distribución de concentración se desplaza también, con una velocidad igual a
JL*E0 , en donde JL* es la movilidad ambipolar y E 0 es el campo aplicado. (En
(10.3-32) se supone que las condiciones son tales que D* y JL* son iguales a Dp y
Jlp; pero es posible que esto no pueda aplicarse a todos los casos.) Parece que el
tiempo t 0 requerido para que el máximo del impulso de concentración atraviese la
distancia conocida d entre el emisor y el colector es
d d
1 -----
0- v- Jl*Eo (10.4-1)
lo cual da
Jl * =d- (10.4-2)
toEo
Si las condiciones son tales que JL* es igual a - Jln o Jlp (es decir, si la
muestra es fuertemente extrínseca), este experimento permite medir con precisión la
movilidad de arrastre de los portadores minoritarios.
Desafortunadamente el impulso que llega al colector no es perfectamente agu-
do, sino que más bien es ancho debido a la difusión, como se ve en la figura
10.7(b). Esto no causa dificultades en las mediciones; pero origina ciertos errores en
la interpretación de los datos, a menos que se tenga un cuidado extremo. Pues lo
que realmente se ve en la pantalla del osciloscopio no es una gráfica de la concen-
tración en función de la distancia en un tiempo fijo dado, sino una gráfica de la
concentración en un punto específico en función del tiempo, 8p(d,t). Una medición
del máximo de esta curva no representa exactamente el tiempo de arrastre, a menos
que se arreglen las condiciones del experimento de tal suerte que se produzca un
mínimo de dispersión por difusión, conforme la distribución sufre un arrastre entre ~
el emisor y el colector. Por ejemplo, supóngase que el campo aplicado es cero.
Entonces, la distribución de portadores en exceso se difundirá como se indica en la
figura 10.7(a). Sin embargo, aunque no haya un campo aplicado en este caso, se ve
claramente en la figura que se observará un máximo de la concentración como
función del tiempo, en un punto x = d. En el ejemplo presentado en esa figura, el
máximo se produce más o menos en t = t 3 • Este máximo se observa simplemente
porque el transporte por difusión por sí solo basta para mover el exceso de porta-
374 Exceso de portadores en semiconductores

dores perteneciente a la distribución, del emisor al colector y luego más allá. Este
efecto conduce a la observación de un tiempo de arrastre finito en ausencia de UD
campo que, de acuerdo con (10.4-2) corresponderá a una movilidad infinita. Eviden-
temente, si lo que significa tiempo de arrastre t 0 es el lapso que transcurre entre la
inyección y la observación del valor máximo obtenido por op(d,t), según lo cla
( 10.3-32) (y que es lo que en realidad se mide en el trazo del osciloscopio), enton-
ces, la ecuación ( 10.4-2) no puede ser correcta tal y como está expresada.
En realidad, la ecuación (10.4-2) es más o menos correcta siempre que l2
dispersión por difusión de la distribución de portadores sea razonablemente pequeña
durante el tránsito del emisor al colector. Estas condiciones se pueden efectuar
experimentalmente mediante el uso de campos aplicados muy grandes que, no obs-
tante, producen efectos de calentamiento graves a menos que se recurra a técnicas
de pulsos muy laboriosas. Una alternativa es derivar una expresión correcta para el
tiempo de tránsito a partir de (10.4-2) que toma totalmente en cuenta la difusión
para llegar a una expresión modificada 11 de la forma

(10.4-31

en donde

x = 2kT (~ + ~). (10.4-41


eE 0 d r 2

Por supuesto, es necesario conocer el tiempo de vida de los portadores en


exceso T para utilizar esta fórmula; sin embargo, como se verá más adelante, esta
cantidad se puede determinar fácilmente mediante una simple medición indepen-
diente. Los detalles del cálculo de (10.4-3) quedan asignados como ejercicio para el
lector.
En el capítulo 13 se demostrará cómo el funcionamiento del transistor se
puede explicar y comprender basándose en el experimento de Haynes-Shockley. Si se
mide tanto la dispersión de la difusión, como el tiempo de tránsito, se puede determinar
el coeficiente de difusión D* al igual que la movilidad de arrastre, aplicando la técnica
Haynes-Shockley. Esta posibilidad se ha utilizado 12 para verificar experimentalmente la
relación de Einstein en muestras de germanio muy extrínsecas.

10.5 RECOMBINACION SUPERFICIAL Y CONDICIONES


DE FRONTERA SUPERFICIALES

Si el efecto de las superficies de un cristal fmito tuviera como único fin


confmar a los portadores de carga al interior de la muestra, entonces la condición de
frontera que la distribución de portadores de carga en exceso tendría que satisfacer
en las superficies de la muestra sería simplemente que las corrientes de electrones y
huecos deben desvanecerse en las superficies. Sin embargo, la situación no es tan
sencilla, ya que los portadores de carga pueden recombinarse err la superficie por
medio de mecanismos que son muy independientes de los que regulan las velocidades

11 J. P. McKelvey, J. Appl. Phys., 27, 341 (1956).


Transistor Teachers Summer Schooll (Bell Telephone Laboratories), Phys. Rev., 88.
12
1368 (1952).
Recombinación superficial y condiciones de frontera superficiales 375

de recombinación de los portadores de carga en el interior de la muestra. En estas


circunstancias, la superficie actúa como un absorbedor parcial de electrones y hue-
cos, y puede haber una corriente neta que fluye hacia las superficies de la muestra.
A primera vista, se podría pensar que, puesto que los electrones y los huecos
pueden recombinarse en la superficie de un cristal, debe haber una deficiencia en la
concentración de portadores de carga cerca de la superficie, que produciría una
corriente difusiva de portadores hacia la superficie, aun en el estado de equilibrio
térmico. No obstante, esto no sucede debido a que, además de la recombinación, la
generación térmica de pares electrón-hueco se produce también en la superficie y, en
condiciones de equilibrio térmico, la velocidad de generación es idéntica a la velo-
cidad con la que los pares de portadores se recombinan en la superficie. Por tanto,
no existe un flujo neto hacia la superficie ni se produce cambio alguno en las
concentraciones de la regtón de la superficie en condiciones de equilibrio térmico. 13
Esta situación es un ejemplo específico de un principio muy general de la mecánica
estadística, denominado el principio del balance detallado o el de la reversibilidad
microscópica. Este principio establece que en la condición de equilibrio térmico,
cualquier proceso microscópico dado y su proceso inverso debe producirse a la
misma velocidad. Ya se encontró antes un ejemplo de la validez de este principio
cuando se comprobó que la velocidad de recombinación volumétrica en equilibrio de
pares electrón-hueco y la velocidad de generación térmica volumétrica son iguales.
La situación actual, en que la velocidad de recombinación superficial y la de gene-
ración térmica superficial son iguales en la condición de equilibrio, sirve sólo para
ilustrar la misma ley general. Por supuesto, debe hacerse notar que el principio del
balance detallado se aplica sólo al estado de equilibrio térmico. En el ejemplo que se
estudia, la velocidad de generación térmica superficial es una función exclusiva de la
temperatura y es muy independiente de las concentraciones locales de portadores de
carga, en tanto que la velocidad de recombinación depende clara y directamente de
las concentraciones locales de portadores. Si la concentración local de los portadores
de carga excede el valor del equilibrio térmico, la velocidad de recombinación super-
ficial sobrepasará la velocidad de generación superficial y como resultado se tendrá una
absorción neta de portadores en la superficie que, a su vez, establecerá un flujo por
difusión de portadores hacia ella. Si se tiene una deficiencia de concentración de
portadores en exceso en la cercanía de la superficie, también se producirá un flujo
por difusión de portadores en exceso térmicamente generados que se aleja de la
superficie. Por supuesto, se pueden hacer observaciones similares en relación al flujo
de portadores en el volumen, que se originan por excesos o deficiencias locales en
las concentraciones volumétricas de portadores. Es importante comprender que estas
conclusiones generales son válidas independientemente de los mecanismos en par-
ticular implicados en los procesos de generación y recombinación.
El efecto de la recombinación superficial sobre la distribución de portadores de
carga dentro de la muestra se puede investigar ahora, considerando el intercambio de flujo
entre la superficie y la región interior de la muestra, como se ilustra en la figura 10.10. Se
principiará definiendo el coeficiente de reflexión superficial R 0 como la probabilidad
de que un solo portador, en una sola colisión con la superficie, sea devuelto al
interior del volumen en lugar de ser absorbido por recombinación. La probabilidad
correspondiente de recombinación, por tanto es 1 -- R 0 • De igual manera, el coefi-

13 Este enunciado se aplica al modelo simple de la superficie que se está viendo. Existen
cambios en la concentración de portadores en equilibrio cerca de la superficie asociados con una
capa de carga espacial superficial, originada por la presencia de estados superficiales, en la super-
ficie física real de la muestra como se verá más adelante. El punto de vista sencillo aquí
adoptado casi siempre es adecuado para un estudio fenomenológico de la recombinación superfi-
cial.
376 Exceso de portadores en semiconductores

Flujo incidente A Flujo que se desarrolla debido a la


neto generación térmica superficial

F,-
8

-X

Concentración local de
portadores en la región
de la superficie: P,

interior: coeficiente Superficie: coeficiente


de reflexión B de reflexión Ro

Figura 10.10. Diagrama de flujo que ilustra el intercambio de flujos entre el interior y la
superficie.

dente de reflexión volumétrica B se define como la probabilidad de que un porta-


dor, al entrar al interior del cristal, proveniente de la superficie, reaparecerá en ésta
en el curso de su desplazamiento aleatorio a través del material antes de recombi-
narse en el interior. Se supone que estos coeficientes son independientes de los
flujos o las concentraciones de portadores. Entonces, se puede considerar el sistema
de flujos establecido entre la superficie y el interior, como se ilustra en la figura
10.10. Se supone que hay un flujo neto de partículas de magnitud A, que se origina
en el interior, y el flujo de generación superficial gs está dirigido de la superficie al
interior del cristal. La superficie del cristal de la figura 10.1 O se muestra separada
del interior para ilustrar con claridad el intercambio de flujos entre estas dos; pero.
por supuesto, las dos regiones son físicamente contiguas en realidad. El flujo total
F 1 , que va del interior a la superficie, y el flujo inverso total F ~ se pueden obtener
observando que F 1 se compone del flujo incidente A más la parte de F; que es
reflejado por el volumen, de donde,

(10.5-1)

De igual manera,

(10.5-2)

Estas dos ecuaciones se pueden resolver para F 1 y F;, y dan


F _A+ Bg, (10.5-3)
1 - l-R 0 B
y
, _ g, + AR 0
F¡ - (10.5-4)
1- R 0 B

Ahora se puede demostrar fácilmente que, para una distribución de partículas


libres que obedece a la estadística de Boltzmann, el número de partículas por uni-
dad de tiempo que cruza una superficie plana de área en cualquier dirección, es
Recombi1lllción superficial y condiciones de frontera superficiales 377

pCJ4, en donde pes la concentración local de partículas. 14 En el estado de equilibrio


térmico, la concentración de partículas es p 0 en todos los puntos y

F 1 = F; = p 0 c/4. (10.5-5)

Estos valores de F 1 y F; se puede substituir en (10.5-3) y (10.5-4) y el par de


ecuaciones resultantes se resuelve para g8 y A 0 , que es el valor del flujo incidente A
en condiciones de equilibrio térmico, lo cual da
Po e (10.5-6)
g.= --¡-(1- R0 )

y
Po e
A0 = --¡-(1- B). (10.5-7)

Ya se vio en el argumento anterior que, en el estado de equilibrio térmico, F 1


y F; tienen el valor común pc/4. Si existe una desviación del equilibrio térmico
producida por un flujo por difusión establecido por un gradiente de concentración, y
si esta desviación del estado de equilibrio es tan pequeña que la distribución de
Boltzmann sigue siendo más o menos correcta en todos los puntos del sistema,
entonces, F 1 y F 1' ya no serán iguales. En estas circunstancias, se debe tener en
c"Uenta el flujo positivamente dirigido que llega al punto x 0 y que se originó, en
promedio, a una distancia del orden de la trayectoria libre media "corriente arriba"
y el flujo negativamente dirigido que llega al mismo punto y que se originó a una
distancia promedio del orden de la trayectoria libre media "corriente abajo". En-
tonces, el flujo con dirección positiva F; se puede escribir como sigue

F¡ = [p(xo)- ,(ap)
ax
]:¡·e
::XA xo
(10.5-8)

en donde a es una constante numenca del orden de la unidad, ya que la cantidad


entre paréntesis angulares representa, aproximadamente la concentración local en el
punto en que se originó el flujo que llega a x 0 • De igual manera, el flujo con
dirección negativa F 1' se puede escribir como

(10.5-9)

Es obvio que la ~urna de los flujos debe ser, entonces,

(10.5-10)

en donde p es la concentración local, independiente del gradiente de concentración,


con tal que la función de distribución no se perturbe seriamente de su forma en
equilibrio.
Si se usa (10.5-10) para expresar la suma de los flujos F 1 y F; en la región
de la superficie y, si se usan las expresiones (10.5-3), (10.5-4) y (10.5-6) para
representar F 1 , F; y g8 , se obtiene

14 Por ejemplo, véase el ejercicio 7 que aparece al final del capítulo 5.


378 Exceso de portadores en semiconductores

p.c _ F F' _ A(1 + R 0 ) p0 c (1 - R 0 )(1 + B)


(10.5-11)
T - 1 + 1 - 1 - R0 B +4 1 - R0 B '

en donde Ps representa la concentración en la cercanía de la superficie. Por su-


puesto, se debe recordar que, aunque g8 tiene el mismo valor que en el estado de
equilibrio térmico, esto no se aplica a A, cuya magnitud depende de la naturaleza de
la distribución de portadores en exceso que pueda estar presente en el volumen. En
efecto, la ecuación (10.5-11) debe resolverse para A, de tal modo que dé

p.c 1 - R 0 B Poc (1 - R0 )(1 + B)


A=---- (10.5-12)
2 1 + R0 4 1 + R0

La diferencia entre F 1 y F:
es el flujo neto de portadores que, si no se tiene
un campo eléctrico, como se supondrá, es igual a la corriente neta de difusión
-Dp(o(fJp)/ox) evaluada en las superficies. Si se escribe la expresión para F 1 - F 1'.
usando (10.5-3) y (10.54) para representar los flujos y a (10.5-6) y (10.5-12) para
representar los valores de g8 y A, se puede obtener, después de numerosas operacio-
nes algebraicas complejas, pero directas,

F1 _ F~ = A(l - R 0 ) _ g.(l - B) =(p.- p 0 )c 1 - R 0 = -DP(i!(bp)). (10.5-13)


1 - R0 B 1 - R0 B 2 1 + R0 ox s

En realidad, esta ecuación es un enunciado de la condición de frontera super-


ficial que se debe aplicar a la ecuación de continuidad. Esto se puede expresar
convenientemente en la forma

iJ(bp))
-Dp ( ---a;- S= S. (bp). (10.5-14)

en donde
e 1- R 0
S=----. (10.5-15)
21 + R0
Los subíndices s indican que las cantidades implicadas se evalúan en la super-
ficie. Por lo general, la constante s se denomina la velocidad de recombinación
superficial; su relación con el coeficiente de reflexión más fundamental está dada por
(10.5-15). La condición superficial de frontera (10.5-14) se puede expresar en forma
vectorial más general como sigue

-DP[n • V(bp)]. = s · (bp)., (10.5-16)

en donde n es un vector unitario saliente, normal a la superficie.


Si no existe una recombinación superficial, R 0 = 1 y s =O, de acuerdo con
(10.5-5). En este caso, (10.5-14) da o(óp)/ox =O, correspondiente a la condición en
que no se tiene un flujo neto difusivo hacia la superficie. Si los portadores se recom-
binan inevitablemente al llegar a la superficie, Ro =O y s =e /2; evidentemente,
este valor es un límite superior para la velocidad de recombinación superficial.
No obstante, en este caso restrictivo es muy común hacer que s = oo en (10.5-14),
que equivale a hacer que la concentración de portadores en exceso de la superficie
(óp)8 sea cero. Se puede demostrar que esta aproximación, que facilita enormemente
los cálculos, es apropiada, a condición de que Dp/Lp ~ C/2. Para el germanio a
300°K, DP ~SO cm 2 /seg, e~ 107 cm/seg, y Lp es casi siempre mayor que 10- 3 cm;
Fotoconductividad de estado estacionario 319

por tanto, la condición queda perfectamente satisfecha y este constituye un ejemplo


típico. A decir verdad, las circunstancias en las que se viola el requisito se presentan
muy raramente y, por tanto, casi siempre se justifica adoptar la condición de fron-
tera s = oo ó (8p )8 = O en el límite superior de la recombinación superficial. Se
asignará como ejercicio para el lector, un ejemplo que demuestre con claridad el
origen de la condición que se acaba de ver. En todos los casos intermedios en los
que la probabilidad de recombinación no es ni cero ni la unidad, se debe usar la
condición de frontera de la forma (10.5-14). Todos los cálculos anteriores se desarro-
llaron en relación con un exceso de huecos en un material tipo n; pero, por supues-
to, se pueden aplicar observaciones exactamente iguales a los electrones en exceso en
un semiconductor tipo p.
En el germanio se pueden obtener coeficientes de reflexión muy elevados
(-0.99999) correspondientes a velocidades de recombinación superficial del orden de
100 cm/seg, en muestras cuyas superficies se han preparado mediante un cuidadoso
proceso de ataque químico. En muestras cuyas superficies han quedado muy dañadas
por pulimento u otra acción abrasiva, existen muchas dislocaciones y otras imper-
fecciones de red en la superficie que pueden actuar como centros de recombinación.
En tal caso, la velocidad de recombinación superficial puede sobrepasar a 105 cm/seg,
correspondiendo esto a un valor de menos de 0.99 para el coeficiente de refle-
xión.15 En el silicio, la velocidad de recombinación superficial es casi siempre
mucho mayor en superficies atacadas químicamente, por ejemplo un valor típico sería
más o menos 2000 cm¡ seg.

10.6 FOTOCONDUCTIVIDAD DE ESTADO ESTACIONARIO

Para ilustrar la aplicación de algunos de los principiOs que se vieron en las


secciones anteriores, se procederá a calcular la respuesta de fotoconductividad en
estado estacionario, de una muestra uniforme de semiconductor que se ilumina con
una radiación de una longitud de onda lo suficientemente larga que permita ser
absorbida sólo ligeramente al pasar por el cristal; pero, al mismo tiempo, lo suficien-
temente corta para crear una concentración medible de pares electrón-hueco. Por
tanto, una longitud de onda apropiada quedará justamente en el lado de las longi-
tudes de onda largas del borde de absorción en la posición A. 1 de la figura 10.l(a).
Se supondrá que esta muestra tiene la forma de un sólido rectangular cuyas dimen-
siones son x 0 , Yo, z 0 , y cuyo espesor x 0 es mucho menor que las otras dimensiones
Yo y z0 , y que la iluminación es incidente a lo largo de la dirección x, como se ilustra en
la figura 10.11. Las dos superficies grandes de la muestra se han preparado en la misma
forma para producir la misma velocidad de recombinación superficial s en ambos lados. Si
el coeficiente de absorción es relativamente pequeño, se puede considerar que la inten-
sidad de la luz es más o menos uniforme en todo el cristal. Esto llevará a una
velocidad de generación de portadores en exceso g, que es constante y proporcional
a la intensidad de la luz. En una muestra larga y delgada del tipo que se ilustra, la
concentración de portadores en exceso varía esencialmente sólo en la dirección x, lo
cual permite utilizar la fórmula unidimensional de la ecuación de continuidad. Puesto

15 El coeficiente de reflexión Ro casi siempre está muy cerca de la unidad en el caso del
germanio y el silicio, incluso en muestras cuyas superficies están muy raspadas. Sin embargo, en
muchos casos el efecto de una velocidad de recombinación de lOS cm/seg correspondiente a
R 0 = 0.99, se podrá distinguir apenas de la condición en que s = c/L. y R =O.
380 Exceso de portadores en semiconductores

Iluminación

jjJ 1
~z/ í0T''
============~:::::JI \Con~uctor de
t:'

,, 1 1 1 '""''""
Iluminación

Figura 10.11. Geometría del experimento de fotoconductividad que se analizó en la sec-


ción 10.6.

que no existen campos en la dirección x y, dado que en la condición de estado


estacionario o(f>p )fot = O, la ecuación ( 10.2-26) toma la fonna

(10.6-1)

en donde g' es constante. Al escribir la ecuación de esta forma, se está suponiendo que se
trata de un material extrínseco tipo n y que f>p es pequeña en todas partes en compara-
ción con la densidad de portadores mayoritarios.
La solución de esta ecuación se puede expresar como la solución general de la
ecuación homogénea (10.3-3) más una solución particular de (10.6-l). Es evidente
que f>p =g'L~/Dp =g'rp es justamente una solución particular de (10.6-1) y que la
solución general de (10.6-1) se puede escribir como sigue

X X
bp(x) =A cosh- + B senh- + g'rP. (10.6-2)
LP LP

Debido a la geometría simétrica de la muestra que se ilustra en la figura 10.11,


f>p(x) debe ser una función par de x, en donde B =O y (10.6-2) se convierte en

bp(x) =A cosh ~ + g'rr (10.6-3)


Lp

Si a esta ecuación se aplica la condición superficial de frontera (10.5-16) en

cualquier superficie ( x = ±;o) se puede evaluar la constante A y se obtiene


A= -sg'rP
(10.6-4)
x0 D x0
s cosh - + ..J!. senh -
2LP LP 2LP
Fotoconductividad de estado estacionario 381

op(x) = g'tp
[
1-
x0 DP
2LP LP
scosh
Xp
x0
s cosh- +- senh-
2LP
.
L
l (10.6-5)

El perftl de concentración op(x) se ilustra en la figura 10.12(a) para diferentes


valores de s.

Sp(x)

Lp Lp
2
(a) (b)

Figura 10.12. (<t) Perfiles de concentración dentro de la muestra ilustrada en la f~gura 10.11
para s =O, s =oo y varios valores intermedios de s. (b) Respuesta de fotocon-
ductividad OC/C 0 en función del espesor x 0 graficada para varios valores de s.

El cambio en la conductancia debido a la presencia de portadores en exceso


será proporcional al número total de portadores en exceso que están presentes en la
muestra. Si se usa oP para representar el número total de huecos en exceso y oN
para la cantidad total de electrones en exceso, entonces,

oP = oN = y 0 z0 fxo/2

-xo/2
op(x) dx, (10.6-6)

en donde y 0 z 0 es el área superficial de la cara iluminada de la muestra. Si se


emplea (10.6-5) para representar op(x) en (10.6-6), la integral se puede evaluar

l
fácilmente de tal modo que dé

sLPsenh 2L
Xo (10.6-7)
oP = oN = 2yozog'tp [ Xo- D p •
Xo P Xo
s cosh- + - senh-
2LP LP 2LP

El elemento diferencial de conductancia entre los electrodos extremos asociados


con. una hoja delgada del material, con un espesor dx, está dado por
382 Exceso de portadores en semiconductores

de = u(x) da = z0 u(x) dx . (10.6-8)


Yo Yo

Sin embargo,
u(x) = u 0 + bu(x) = u 0 + e¡J.Pbp(x)(b + 1), (10.6-9)

de donde,
de= Zo [u0 + e¡J.p(b + 1)<5p(x)] dx. (10.6-10)
Vo
Al integrar esta ecuación entre los límites x = ± x 0 /2 se obtiene

Z X Z fxo/2
e=~ U o + ~ e¡J.p(b + 1) bp(x) dx. (10.6-11)
Yo Yo -xo/2

No obstante, el primer término anterior es la conductancia de equilibrio


(= a0 • área/longitud) en tanto que en el segundo, la integral se puede expresar en
función de óP mediante (10.6-6). Haciendo esta substitución en (10.6-11) se puede
escribir como

e= eo + epp(b ~ l)bP = Co + i)C. (10.6-12)


Yo

Entonces, el cambio relativo de conductancia se puede expresar como óCfe0 •


en donde e0 = uozoxo/Yo, en donde,

be e¡J.p(b + l)(jP
-= (10.6-12)
u0 V

en donde óP está dada por ( 10.6-7) v V = x 0 y 0 z 0 es el volumen de la muestra. En


la tigura 10.12(b) se ilustra la fotoconductancia óC/e0 graficada en tunción del
espesor de la muestra para diferentes valores de s. Por supuesto, para s =O, la
cantidad óP y, por ende, óe es independiente del espesor de la muestra x 0 . Para
s >O, la fotoconductancia es muy pequeña en muestras delgadas, ya que en este
caso, los portadores se pueden difundir con gran rapidez hasta la superficie y recom·
binarse allí. Para muestras más gruesas, los portadores del interior llegan a la super-
ficie sólo después de una gran difusión y la recombinación superficial tiene mucho
menos efecto en la conductancia general. En el límite x 0 --+ oo el efecto de la superfi-
cie se vuelve insignificante. Es evidente que si las dimensiones de la muestra, Dp, la
velocidad de generación g' y una de las cantidades (s, Lp) son factores conocidos, s
o Lp, cualquiera que se desconozca, se puede medir en este experimento. Si se usan
dos muestras diferentes, idénticas en todo excepto el espesor, se pueden determinar
tl'•itO s como LP. La principal dificultad en el uso del efecto de fotoconductividad
..te estado estacionario, como técnica para determinar s o Lp, consiste en conocer la
velocidad absoluta de generación g', la cual es difícil determinar en cualquier expe-
rimento. Esta dificultad se elimina si, por el contrario, se mide la fotoconductividad
transitoria. En la siguiente sección se hace un análisis de este efecto.
Fotoconductividad transitoria 383

10.7 FOTOCONDUCTNIDAD TRANSITORIA; TIEMPO DE VIDA


DE LOS PORTADORES EXCEDENTES

En esta sección se estudiará el decaimiento transitorio de la fotoconductividad


producida por una radiación penetrante en la muestra, exactamente como la que se
vio en la sección anterior. Se supondrá que la fuente de luz ha generado una
densidad de portadores p 1 (>p 0 ) que es uniforme en todos los puntos dentro de la
muestra en el tiempo t = O, instante en que la radiación de excitación se corta
bruscamente. Entonces, ( 10.2-26) describe el decaimiento subsecuente de la distribu-
ción de portadores en exceso hasta el estado de equilibrio, descrito por (10.2-26)
que, para este caso toma forma

o2 (bp) bp(x,t) o(bp)


D -------- (10.7-1)
P ox 2 rp - ot .

Las condiciones de frontera 16 superficiales son

o(bp))
-DP ( - - = sbp(x 0 /2,t) y
a(op))
DP (- - = sbp( -x 0 /2,t), (10. 7-2)
OX xo/2 OX -xo/2

además también se requiere que,

bp(x,O) = p 1 = const (10. 7-3)

y
lim bp(x,t) =O. (10.7-4)

Al hacer la substitución

bp(x,t) = e-' 1'Pu(x,t) (10.7-5)

la ecuación (10.7-1) se puede transformar en una ecuación diferencial para u(x, t) de


la forma

(10. 7-6)

en tanto que las condiciones de frontera se transforman en

- DP(:~)X xo/2
= su(x 0 /2,t); DP(~u)
uX -xo/2
=su( -x /2,t) 0 (10.7-7)

y
u(x,O) = p 1 = const (- X 0 /2 < X < X 0 /2). (10. 7-8)

16 Aunque para llegar a la forma (1 0.5-16) se supuso una condición de estado estacionario
en la condición de frontera, es evidente que esta condición de frontera se puede usar también en
situaciones dependientes del tiempo, a condición de que la concentración de portadores de carga
en la superficie no cambie mucho en el tiempo requerido para que se establezca el flujo de
equilibrio entre la superficie y el volumen. Siempre se supondrá que esta condición se satisface.
384 Exceso de portadores er¡ semiconductores

A continuación se buscarán soluciones producto de la forma

u(x,t) = X(x)T(t). {10.7-9)

Al substituir esta forma para la solución en {10.7-6) se observa que

1 d2X 1 dT
- - - -2 = - - - -- = -a 2 = const. (10.7-10)
X(x) dx DPT(t) dt

Los dos lados de la ecuación anterior deben ser iguales a una constante, pcr
separado, ya que sólo en esta forma puede una sola ecuación de x y una sola
ecuación de t ser iguales para todos los valores posibles de x y t. La constante se
escribe como -a:2 , de manera que, para cualquier a: real, será negativa; esto es
necesario (como se comprobará en breve) para tener la seguridad de que (10.7-4) quede
satisfecha. Para la dependencia del tiempo de la ecuación anterior, es obvio que

(10.7-11)
de donde

{10.7-12)

Para la dependencia espacial, se tiene

(10.7-13)
por lo cual

X(x) = A cos ax + B sen ax. (10.7-14)

Por la simetría del problema, está claro que la dependencia espacial de la


concentración de portadores en exceso debe ser siempre una función par de x. Sin
embargo, una función sinusoidal o cualquier superposición de funciones sinusoidales,
es invariablemente impar en tanto que un coseno o cualquier superposición de cose-
nos es par. Evidentemente, este requisito físico se puede satisfacer sólo mediante una
función coseno o por una superposición de funciones coseno. Por tanto B debe
hacerse igual a cero en (10.7-14). De acuerdo con (10.7-9), (10.7-12) y (10.7-14), es
obvio que una solución apropiada debe tener la forma

u(x,t) =X(x)T(t) = Ae-tz 2 Dpt cos ax. {10.7-15)

Esta solución por sí sola satisface la ecuación diferencial (10.7-6); pero no


satisface las condiciones de frontera (10.7-7) y (10.7-8). No obstante, se puede
desarrollar _una superposición lineal de soluciones de esta forma tales que

(10.7-16)
n n

que sigue satisfaciendo la ecuacton diferencial, y se está en libertad de seleccionar


los valores An y an de tal modo que la superposición satisfaga las condiciones de fron-
Fotoconductividad transitoria 385

tera. En cada ténnino de la suma de (10.7-16), se requiere que se satisfaga la condición


de frontera superficial

(10.7-17)

entonces, por supuesto, las condiciones de frontera superficiales (1 O. 7-7) quedarán


satisfechas automáticamente por dicha superposición. 1 7 Substituyendo una solución de
la forma (10.7-15) en lugar de un en (10.7-17), se encuentra que para satisfacer
(10.7-17), se debe tener

(10.7-18)

de donde, cxn debe escogerse en tal forma que se satisfaga la ecuación

- - = rxnDp
ctn CXnXo - - (2D 1sx 0 )
- - = (J.nXo (10.7-19)
2 S 2 P

Las raíces de esta ecuación se pueden obtener numérica o gráficamente como la


intersección de las curvas f(cxx 0 )=ctn(+cxxo) y f(cxxo)=(fcxxoX2Dp/sxo), como se
oiJustra en la figura 10.13.
Ahora se tratará de satisfacer la condición de frontera (10.7-8). Se intentará
lograrlo seleccionando valores de An de tal suerte que, en t =O, la suma de todos
los valores de Un(X, O) se sumen para formar una representación tipo Fourier del
perfil de concentración inicial requerido. Para lograr esto, supóngase que u(x, O) es
una función par arbitraria 18 f(x), de tal modo que

00

u(x,O) = L A" cos cx"x = f(x).


n=O
(10.7-20)

f (ax 0 1

,. a 1x0
-2-

Figura 10.13. Diagrama que ilustra la determinación de las raíces de (10.7-19) mediante la
solución gráfica de la ecuación trascendental.

17 Obsérvese que si u(x, t) es una función par de x, si se da una de las condiciones de frontera,
(10.7-7), se da la otra.
18 Si f(x) no fuera par, sería necesario admitir soluciones de la forma Bnexp(- ai,Dpt)
sen a,.x en la superposición, junto con la función coseno que se está usando.
386 Exceso de portadores en semiconductores

Si los dos lados de esta ecuación se multiplican por cos OtmX y se integran
sobre e! intervalo ( -x0 /2 < x < x 0 /2), el resultado es

xo/2 fxo/2
Lf An COS OCnX COS OCmX dx = j(x) COS OCmX dx. (10.7-21)
n -xo/2 -xo/2

Si el conjunto de funciones cos OtnX es ortogonal en el intervalo (- x o /2 < x <


x 0 /2), todas las integrales del lado izqUierdo de esta ecuación se desvanecen excepto
aquella para la que n = m, que se evalúa con facilidad. En estas circunstancias, al
resolver para A m, se puede demostrar que

(10. 7-22)

Esto deja ver que, puesto que se trata de un caso especial del problema de
Sturm-Liouville, las funciones {cos ocna} deben formar un conjunto ortogonal. 19 En
cualquier caso, no es difícil demostrar directamente que, a condición de que los
valores de Otn se escojan de tal manera que satisfagan ( 10.7 -19), las funciones
{cos ocna} son ortogonales. Los detalles de esta demostración quedan como ejercicio
para el lector.
Para el caso presente, se debe escoger f(x) = p 1 =constante y, con esta selec-
ción, la integral de (10.7-22) se puede evaluar fácilmente y se obtiene

OCnXo
4p 1 sen - 2- (10.7-23)
A
n
=-----
OCnXo +Sen OCnXo

de donde,

f(x) = p 1 = 4p 1 (10.7-24)

Ahora se puede encontrar u(x, t) substituyendo el valor anterior para An en


(10.7-16) y luego se puede obtener óp(x, t) a partir de (10.7-5). El resultado final es

(10.7-25)

Cuando s--* O, la pendiente de la línea recta que aparece en la figura 10.13 se


hace extremadamente grande y los valores propios {ocna} tienden a (O, 2rr, 4rr, 6rr ••• r
Para este conjunto de valores, sen (Otna/2) =O para todos los valores de Otn y todos
los términos de la suma de (10.7-25) se desvanecen con la excepción del primero.
En el caso del primer término, tanto el numerador como el denominador desapa-
recen dando origen a una forma indeterminada. Utilizando la regla de L'Hopital se
puede demostrar que

19 R. V. Churchill, Fourier Series and Boundary Value Problems. Nueva York: McGraw-
Hill (1941), páginas 46-5 2.
Fotoconductividad transitoria 387

ct 0 x 0 1 ct x
sen - 2- 2cos - 02-0 1
lim = lim = -, (10.7-26)
aoxo~O IXoXo +Sen IXoXo aoxo~O 1 + COS IXoXo 4

por lo cual,

(s = 0). (10.7-27)

En la figura 10.14(a) se muestra el perftl de concentración para este caso,


graficado para varios valores de t. Es obvio que la concentración sigue siendo la
misma en cualquier tiempo dado, en todos los puntos de la muestra.
Si s-+ oo, la pendiente de la línea re.:ta de la figura 10.13 tiende a cero y los
valores propios {1X"a} tienden a (7T,37T,S7T,77T, ... ) en el límite. En este caso, (10.7-25)
se convierte en

(2n + 1)rrx
oo ( -1)" cos x0 [ (2 n + 1)2 rr zv Pt ]
bp(x,t) = 4p 1 e-' 1'P L
n=O (2n + 1)1!
exp - 2
Xo
• (10.7-28)

que es una serie ordinaria de Fourier. En este caso, cuando x = ± x 0 /2, op es cero
+
ya que cos (n + )11 = O. El perfil de concentración para este caso aparece graficado
en la figura 10.14(c). Para valores intermedios de s, los valores {a"} deben deter-
minarse numérica o gráficamente y cuando se grafican los resultados, deben producir
perftles de concentración como los que se presentan en la figura 10.14(b).
La fotoconductancia real se puede obtener a partir de op(x,t) por medio de
(10.6-12) y (10.6-6), de acuerdo con lo cual,

bC(t) ef.J.p(b + 1) fxo/ 2


-- = V · y0 z 0 bp(x,t) dx, (10.7-29)
Co ao -xo/2

1=0 1 =O 1=0

,, t, t,

/z lz

13 13
/4 14

-~
o ~ xo o xo Xo o Xo
2 2 -2 2 -2 2
S=O S>O S=oo

(a) (b) (e)

Figura 10.14. Perfiles de concentración dentro de la muestra para diferentes valores de t, (a)
pata s =O, (b) para s>O, (e) paras= o..>. En todos los casos O< t 1 < tz <r3 <14·
388 Exceso de portadores en semiconductores

o bien utilizando (10.7-25) y evaluando la integral

Esta expreswn es una suma de los términos, cada uno de los cuales tiene su
propia amplitud característica y cada uno de los cuales decae exponencialmente con
respecto al tiempo con una constante de tiempo distinta. Esto se puede escribir en
la forma

(lO. 7-31)

en donde Cm es la amplitud del mésimo modo de decaimiento 20 definido por


(10.7-30) y en donde cada constante de tiempo exponencial se puede expresar como

(10.7-321

Puesto que ao es el miembro más pequeño del conjunto{IX.}, la constante de


tiempo T 0 debe ser mayor que cualquiera de las otras; es más, la forma del factor
de amplitud Cm que multiplica a cada término es tal que las amplitudes de los
términos más altos son más pequeñas que la del primero. m resultado es que los
modos de orden más alto desaparecen con mayor rapidez que el de orden cero y.
después de un tiempo lo suficientemente largo, el decaimiento se puede representar
como una simple exponencial con la única constante de decaimiento del modo
principal r 0 , como se ilustra en la figura 10.15. Evidentemente, si el logaritmo de la
respuesta fotoconductiva se grafica en función del tiempo, se obtiene una línea recta
después que los efectos de los términos de modo más alto de (10.7-30) han desapa-
recido. La pendiente de esta línea es 1/r 0 , en donde

In .!f.
Co

.. 1

Figura 10.15. Logaritmo de la respuesta fotoconductiva transitoria en ·ión del tiempo.

20 El subíndice m se adopta aquí para evitar cualquier confusión posible con el tiempo de
vida del electrón, T n·
Fotoconductividad transitoria 389

(10.7-33)

Existen dos términos en el lado derecho de esta ecuación; el primero de ellos


representa al efecto de la recombinación volumétrica sobre la constante de tiempo
del modo principal observado, y el segundo, el efecto de la recombinación superfi-
cial. El tiempo de vida observado r 0 es más breve que el tiempo de vida volumé-
trico real r P a menos que la velocidad de recombinación superficial sea. cero •. en
cuyo caso, como ya se indicó antes, a 0 = O. Aunque por lo general es nnpoSible
reducir s a cero, de un modo experimental, se puede producir el mismo efecto,
como se señala en la figura 10.13, acomodando las condiciones del experimento de
tal modo que 2Dp/sx 0 sea mucho menor que la unidad. Esto se puede lograr
utilizando una muestra muy gruesa. En estas condiciones, los portadores generados
en el interior deben difundirse una distancia mayor hasta la superficie, cuyo papel es
mucho menos importante que en una muestra delgada, y el tiempo de vida obser-
vado r 0 se aproxima al tiempo de vida volumétrico rea! r P.
Si se conocen los tiempos de vida volumétrico real r P y el de vida observado,
la velocidad de recombinación en la superficie se puede evaluar resolviendo (1 O. 7-33)
para a 0 , insertando el valor obtenido en (10.7-19) y despejando s. El resultado es

(10.7-34)

Esta fórmula también se puede usar para obtener el tiempo de vida volumé-
trico real, si se conocen el tiempo de vida observado y la velocidad de recombina-
ción superficial.
Si se desconocen inicialmente tanto r P como s, se pueden determinar traba-
jando primero con una muestra gruesa cuya superficie se trata en tal forma que se
minimice la recombinación superficial; el decaimiento fotoconductivo transitorio aso-
ciado con este tipo de muestra se aproximará a rP. A continuación, la muestra
gruesa se puede cortar en otras más delgadas y las superficies de éstas se deben
tratar a fin de obtener las condiciones apropiadas para medir la velocidad de recom-
binación superficial. La constante de decaimiento r 0 se mide entonces, y s se saca
directamente de ( 10.7-34) empleando el valor de r P obtenido previamente. Otra
posibilidad es cortar dos muestras de diferentes espesores de un material con un
tiempo de vida uniforme. Las superficies de las dos muestras se tratan de tal modo
que se obtengan las condiciones en las que se desea hacer la medición de s, y se
determine el tiempo de vida observado relacionado con cada muestra. Después, la
ecuación (10.7-34) se puede escribir para cada muestra y las dos ecuaciones se
resuelven numéricamente para las dos cantidades desconocidas r P y s. Un tercer
método consiste en utilizar sólo una muestra y ajustar los valores de r P y s en
( 10.7-30) de tal manera que se reproduzca no sólo la constante de tiempo del modo
principal observado r 0 (que, después de todo se puede obtener en otras combina-
ciones diferentes de r P y s), sino también el patrón de decaimiento inicial del modo
más alto que se observó. Aunque el análisis matemático requerido es complejo, este
método tiene la ventaja de que emplea una sola muestra y con esto se minimizan las
dificultades que producen las heterogeneidades en el tiempo de vida volumétrico y
las velocidades de recombinación superficial.
390 Exceso de portadores en semiconductores

10.8 MECANISMOS DE RECOMBINACION; LA TEORIA


DE RECOMBINACION DE SHOCKLEY-READ

En esta sección se investigarán brevemente los aspectos físicos de la recombina-


ción electrón-hueco. Es importante comprender los procesos físicos asociados con !a
recombinación directa de electrón-hueco, así como en la recombinación por atra-
pamiento, aunque se ha descubierto que esta última es el mecanismo dominante en
la mayoría de las situaciones relacionadas con semiconductores covalentes o interme-
tálicos lii- V.
En la recombinación directa, un electrón de la banda de conducción y un
hueco de la de valencia se recombinan sin la participación de ningún estado inter-
medio. Si las bandas de conducción y valencia tienen separación mínima de energía
en k = O, entonces es posible que se produzcan transiciones verticales en las que un
electrón cercano a la parte superior de la banda de valencia puede recombinarse con
un hueco que está cerca de la base de la banda de conducción. Puesto que en d~cha
transición se debe conservar la cantidad de movimiento, sólo los electrones y los
huecos cuyos vectores k satisfacen la relación

(10.8-1)

pueden interactuar de esta manera. En el proceso se emite 21 un fotón cuya fre-


cuencia w está dada por

(10.8-21

En la figura 10.16(a) se ilustra este proceso de transición directa. La absorción de


un fotón acompañada de la producción de un par electrón-hueco, se puede llevar a
cabo mediante un proceso que es precisamente la inversa de éste. En substancias
tales como el germanio y el silicio, en donde el mínimo de la banda de conducción
ocurre a un valor de la cantidad de movimiento del cristal k 0 que no es cero, la
recombinación de un electrón en el mínimo de la banda de conducción y un hueco
en la parte superior de la banda de valencia, requiere (además de la producción de
un fotón) la emisión de un fonón con una constante de propagación k'= k 0 o la
absorción de un fonón ya presente con una constante de propagación k' = -k 0 , para
que pueda conservarse la cantidad de movimiento del cristal. Este es el proceso que
se conoce con el nombre de transición indirecta. La energía que hubiera portado el
fotón en una transición directa, es ahora el fonón el que la lleva (o la proporciona).
La frecuencia de la radiación asociada con este tipo de transiciones está dada por

(10.8-31

en donde e' (k0 ) es la energía asociada con un fonón cuyo número de onda es k 0 •
según se obtuvo de la relación de dispersión w(k) para las vibraciones de red, como
sigue,

s'(k 0 ) = hw(k 0 ). (10.8-4)

21 En (10.8-1), la cantidad de movimiento que se lleva el fotón emitido se ha desechado


Esto se justifica debido a que la longitud de onda del electrón (para una energía promedio kn.
como lo señala la expresión (8.4-1), es mucho menor que la longitud de onda del fotón para
w ~ .t.E/h. Por supuesto, las cantidades de movimiento están asociadas con la longitud de onda
respectiva por medio de la relación de De Broglie, (4.9-7).
Mecanismos de recombinación; la teoría de Shockley-Read 391

-k

-k
(a) (b)

Figura 10.16. Recombinación electrón-hueco a través de (a} una transición directa y (b} una
transición indirecta.

Aunque la energía e'(k0 ), es pequeña en comparac10n con la energía de la


banda prohibida, !!.e, es perceptible a través de su influencia en la forma de la curva
de absorción, en función de la longitud de onda cerca del borde de absorción.
También en este caso, la absorción de un fonón para producir un par electrón-hueco
se puede considerar como la inversa de este proceso. En realidad, puesto que el
fonón emitido o absorbido puede pertenecer a la rama acústica o a la óptica y
también puede ser de una vibración transversal o longitudinal, existen cuatro fonones
separados que pueden participar en dicho proceso, cada uno de los cuales poset> una
frecuencia diferente y, por ende, una energía e' distinta para k= k 0 . Los efectos de
los cuatro fonones se pueden observar en los espectros de absorción de esta natura-
leza del semiconductor, cerca del borde fundamental de absorción. Por supuesto, las
transiciones directas también se pueden producir en materiales en donde el mínimo
de la banda de conducción no está en k = O; pero sí es apreciable la diferencia de
energía en el borde de la banda de conducción, entre el punto de energía mínima y
k = O, la población de electrones para energías correspondientes a k = O será normal-
mente tan pequeña que tales transiciones son muy poco frecuentes. Del mismo
modo, las transiciones directas de absorción requerirán energías del fotón incidente
que sean mucho mayores que las que se necesitan para promover las transiciones
indirectas. En condiciones normales, las transiciones indirectas son predominantes en
todo los semiconductores elementales covalentes y los semiconductores de compuesto
de los grupos III y V con la sola excepción de InSb, en el que el mínimo y el
máximo de las bandas de conducción y valencia, están en k = O.
En cualquier caso, se puede calcular la velocidad a la que se producen las
transiciones del espectro óptico de absorción observado del material22 y, por tanto,
inferir la velocidad de recombinación y el tiempo de vida de los portadores en

22 En el estado estacionario, las velocidades de generación y recombinación de los pares


electrón-hueco deben ser iguales; por esta razón, el cálculo de la velocidad de generación deberá
dar también la velocidad de recombinación. Sin embargo, para los pares electrón-hueco produ-
cidos por una excitación óptica directa, la velocidad de generación para cualquier longitud de
onda de fotón incidente debe ser proporcional al coeficiente de absorción para dicha longitud
de onda. La curva de absorción óptica y la velocidad de recombinación originadas en procesos
de recombinación directa, entonces están íntimamente relacionadas.
392 Exceso de portadores en semiconductores

exceso, basándose en el espectro de absorción. Van Roosbroeck y Shockley23 fueron


los primeros en efectuar este cálculo y encontraron que, por ejemplo, en el germa-
nio, el tiempo de vida de los portadores en exceso a la temperatura ambiente, debe
ser aproximadamente 0.75 seg, independienten1ente de la densidad de impurezas do-
nadoras y receptoras. Las evidencias experimentales contradijeron este resultado; los
tiempos de vida observados de los portadores en exceso raramente excedieron 1o- 3
seg, y se encontró que eran muy sensibles a la concentración de impurezas don'l-
doras o receptoras. También quedó bien establecido en la práctica, que los tiempos
de vida de los portadores en exceso en el germanio y el silicio se podían reducir
drásticamente introduciendo ciertas impurezas, por ejemplo, el cobre, en concentra-
ciones muy pequeñas y mediante la introducción de ciertas imperfecciones estructu-
rales, por ejemplo, dislocaciones. Además, el cálculo de Van Roosbroeck-Shockley
predijo la dependencia del tiempo de vida de los portadores en exceso en función de
la temperatura, lo cual no se observó experimentalmente. Se demostró que en casi
todos los materiales, los tiempos de vida de los portadores en exceso no se veían
limitados por las transiciones radiactivas del tipo que se vio antes, sino más bien por
algún otro proceso íntimamente relacionado con la presencia de ciertos tipos espe-
ciales de átomos de impurezas e imperfecciones estructurales en pequeñas concentra-
ciones. Estos resultados hicieron que se estudiara la recombinación por el atrapa-
miento de electrones y huecos a través de niveles de energía localizados que se
ubican en la parte profunda dentro de la banda de energía prohibida y que se pensó
estaban asociados con ciertas impurezas y defectos estructurales "de atraparniento ··.
Shockley y Read 24 fueron los primeros en investigar este mecanismo.
La teoría Shockley-Read de la recombinación incluye un estudio de las esta-
dísticas de ocupación de dichos niveles de atrapamiento. Aquí se verá detalladamente
el comportamiento de un nivel de energía a una energía er dentro de la región de
energía prohibida, que es neutra cuando está vacía y que puede ocuparla cualquier
electrón, adquiriendo con ello una carga negativa. Estas trampas pueden promover la
recombinación electrón-hueco, capturando electrones de la banda de conducción y
transfiriéndolos subsecuentemente a la de valencia, siempre que aparezca un hueco
cerca de la trampa para recombinarse con el electrón atrapado. El efecto neto es
desaparecer el par electrón-hueco con lo que el nivel de atrapamiento vuelve final-
mente a su estado original. Puesto que el centro de atrapamiento está casi siempre
acoplado de un modo firme a la red, la energía y la cantidad de movimiento que perte-
necieron inicialmente al electrón y al hueco pueden convertirse en vibraciones de red. En
este proceso se emite muy poca o ninguna energía electromagnética. Existen cuatro pro-

::T T _l_ T
Ev + +
(o) ( b) (e) (d)

Figura 10.17. Cuatro procesos fundamentales comprendidos en la recombinación por medio de


trampas; (a) la capt,ua de un electrón de conducción hecha por una trampa
vacía, (b) la emisión de un electrón desde la trampa hasta la banda de conduc-
ción, (e) la captura de un hueco de la banda de valencia efectuada por una
trampa que contiene un electrón y (d) la promoción de un electrón de valenc~a
a una trampa inicialmente vacía.

23 W. van Roosbroeck y W. Shockley, Phys. Rev., 94, 1558 (1954).


24 W. Shockley y W. T. Read, Jr., Phys. Rev.• 87, 835 (1952).
Mecanismos de recombinación; la teoría de Shockley-Read 393

cesos básicos comprendidos en la recombinación electrón-hueco a través de los centros de


atrapamiento, como se ilustra en la figura 10.17: (a) la captura de un electrón de la banda
de conducción que realiza una trampa vacía inicialmente neutra, (b) la inversa de (a),
incluyendo la emisión de un electrón que ocupaba en un principio un nivel de atrapa-
miento, a la banda de conducción, (e) la captura de un hueco en la banda de valencia rea-
lizada por una trampa que contiene un electrón y (d) la inversa de (e)_ en donde se
promueve un electrón de valencia hacia una trampa inicialmente vacía (esto también
puede considerarse como la emisión de un hueco desde la trampa hasta la banda de
valencia).
En estas circunstancias, la velocidad a la que los electrones de la banda de
conducción son capturados por las trampas, es claramente proporcional al número de
electrones de la banda de conducción y a la cantidad de trampas vacías disponibles
para recibirlos. Esto se puede escribir como sigue

(10.8-5)

en donde Cn es una constante y Nt representa la concentración total de centros de


atrapamiento en el cristal. Del mismo modo, la velocidad a la que los electrones se
emiten desde trampas llenas hasta la banda de conducción, será proporcional al
número de trampas llenas y, por tanto, se puede expresar como

(10.8-6)

en donde En es otra constante de proporcionalidad. De acuerdo con el principio del


balance detallado, en el estado de equilibrio estas dos velocidades deben ser iguales,
de donde,

(10.8-7)

Al substituir en esta expresión el valor explícito de la función de Fermi fo de


(5.5-20), se obtiene la relación muy simple

(10.8-8)

Si se substituye el valor dado por (9.3-6) para n 0 , (10.8-8) se puede escribir,


finalmente, como
(10.8-9)

en donde

(10.8-10)

Al escribir (10.8-9) y (10.8-10), se está suponiendo que la distribución de


electrones en la banda de conducción es de tipo maxwelliano. La cantidad n 1 es la
concentración de electrones que estaría presente en la banda de conducción, si el
nivel de Fermi coincidiera con el nivel de atrapamiento €t. La velocidad neta a la
que se capturan los electrones de la banda de conducción es sólo la diferencia entre
(10.8-5) y (10.8-6) que, usando (10.8-9) para expresar En en función de Cn, es

(10.8-11)
394 Exceso de portadores en semiconductores

Así también, la velocidad a la que se capturan los huecos de la banda de


valencia debe ser proporcional a la concentración de huecos y al número de trampas que
pueden recibir huecos (y, por ende, la cantidad que está ocupada por electrones)
entonces
(10.8-12)

La velocidad a la que los huecos se emiten a la banda de valencia desde los


centros de atrapamiento [proceso ( d) de la figura 10.17] es proporcional a la can-
tidad de trampas ocupadas por huecos (es decir, vacías), de acuerdo con lo cual

(10.8-13)

Igual que antes, en el estado de equilibrio, Rcp debe ser igual a Rep y
razonar1do de un modo análogo a como se hizo al derivar (10.8-9), se puede demos-
trar que

(10.8-14)

en donde,
(10.8-15)

Nuevamente, p 1 puede considerarse como la concentración de huecos que se


encontraría en la banda de valencia si el nivel de Fermi se localizara en la energía
del nivel de atrapamiento. La velocidad neta a la que los huecos se capturan desde
la banda de valencia se puede expresar como

(10.8-16)

Cuando hay centros de atrapamiento presentes, ya no es posible normalmente


suponer que 8n = 8p, a pesar de que se mantiene la neutralidad eléctrica general.
debido a que algunos electrones, que de otra manera estarían presentes en la banda
de conducción como parte de 8n, ahora pueden estar inmovilizados en las trampas.
incapaces de funcionar como electrones de conducción. Esta situación origina ciertas
dificultades cuando la densidad de los centros de atrapamiento es grande, y Shockley
y Read analizaron esta situación detalladamente. No obstante, si NP es muy pe-
queño, la aproximación 8n = 8p sigue siendo aceptable. 25 Se supondrá que este es el
caso, y en la mayoría de las condiciones de interés práctico en semiconductores
covalentes este requisito se satisface. En una muestra en la que los portadores en
exceso se recombinan en estas condiciones, se debe tener Rp = Rn, ya que cada
recombinación de electrón va acompañada de la recombinación de un hueco. La
velocidad común de recombinación se relaciona con eJ tiempo de vida r por medio de

(10.8-17)

Si se iguala (10.8-11) a (10.8-16) y se resuelve para f(e 1 ), se obtiene

(10.8-18)

25 Shockley y Read demostraron que 8n ~8p siempre que cualquiera de las cuatro canti-
dades, no, Po, n¡ y p¡ sea grande en comparación con N.
Mecanismos de recombinación; la teoría de Shockley-Read 395

Al substituir este valor ya sea en (10.8-11) o en (10.8-16) y observando que


niPI = nl,es evidente que

(10.8-19)

Si ahora se escriben = n 0 + 8p, p =Po + 8p, la ecuación anterior se puede exp1 ~ar
en la forma

1 N,(Po + no + ~P) (10.8-20)


1 1
-(no+ n¡ + ~p) +e (Po+ PI+ ~p)
ep n

En el límite en que n 0 ~8p, p 0 , ni, PI es evidente que (10.8-20) se reduce a

1
t = tpo =e N . (10.8-21)
p t

El tiempo de vida de los huecos en una muestra tipo n fuertemente extrínseca


que tiene una concentración de centros de atrapamiento específica, es justamente el
recíproco de epNt· De igual manera, en el límite en que Po ~ 8p, n0 , nI, pI,
(10.8-20) se reduce a

1
t = tno =en N t (10.8-22)

comprobando que en una muestra tipo p fuertemente extrínseca, el tiempo de vida


del electrón es el recíproco de CnNt. Por tanto, (10.8-20) se puede escribir como
sigue

Po+ no+ ~p
(10.8-23)

en donde (rpo, Tno) representa el tiempo de vida del exceso (huecos electrones) en
un material fuertemente extrínseco (tipo n o p) que tiene las características de
atrapamiento particulares que se están tomando en cuenta. El tiempo de vida para
materiales intermedios entre estos dos extremos está dado por (1 0.8-23). Para valores
pequeños de 8p (10.8-23) puede escribirse como

_
t-tpo (no + n¡) +tno (Po +PI) . (10.8-24)
Po+ no Po+ no

De acuerdo con esta ecuación, el tiempo de vida se puede graficar en función


del nivel de Fermi y, por tanto, como una función de n 0 y p 0 • Se ha encontrado
que el tiempo de vida es un máximo cuando el nivel de Fermi se encuentra en
algún punto dentro de la banda prohibida, cuya ubicación exacta depende de los
valores de Tpo, Tno y ni, como se muestra en la figura 10.18. Si Tno y Tpo son
iguales, el máximo se producirá en la condición intrínseca.
La variación del tiempo de vida con el nivel de inyección 8p se puede estudiar
resolviendo (10.8-23) para r, escribiendo el resultado en la forma
396 Exceso de portadores en semiconductores

lu J
Tpo

Ev E¡ Et Ee

Ef-

Figura 10.18. La dependencia del tiempo de vida en función de la energía de Fermi, como lo
predice la teoría Shockley-Read.

(10.8-25)

en donde
(10.8-26)

De acuerdo con esto, se observa que si lip es lo suficientemente pequeña, el


tiempo de vida tendrá el valor T 0 independiente de lip. Para valores más grandes de
lip, el tiempo de vida depende de lip y puede aumentar o disminuir con valores
crecientes de lip dependiendo de los valores relativos de T po. T n 0 , n 0 y n 1. Para
valores grandes de lip, se puede ver que (10.8-25) da

(10.8-27)

Si T _ es diferente de To (como sucede casi siempre), existe una vanac10n


monotónica del tiempo de vida entre los límites T 0 y T _ conforme aumenta lip.
Es difícil establecer comparaciones precisas y significativas entre la teoría de
Shockley- Read y el experimento, debido a la dificultad que representa obtener
muestras con concentraciones controladas con precisión de un solo tipo de centros
de atrapamiento y también debido al número de parámetros desconocidos cuyo
valor se debe determinar (o ajustar para que sean apropiados) de los datos experi-
mentales. 26 Sin embargo, la teoría parece coincidir con todos los resultados expe-
rimentales a los que puede esperarse sean aplicables hasta la fecha. 27 Explica las
variaciones notables observadas del tiempo de vida de los portadores en función de
la densidad de los donadores y los receptores, el nivel de inyección, la concentración
de los centros de atrapamiento y la temperatura. También puede ampliarse para

26 La dificultad consiste no tanto en ajustar los datos experimentales, sino en que se


cuenta con muchos parámetros ajustables que los datos pueden explicar mediante muchos con-
juntos posibles de valores para estos parámetros.
27 Véase, por ejemplo, J. A. Burton y colaboradores, J. Phys. Chem., 57, 853 (1964).
Mecanismos de recombinación; kl teoría de Shockley-Read 397

In 8C
Co

Fase normal

Atrapamiento lento

_,
Figura 10.19. Respuec .otoconductiva transitoria de una muestra que contiene gran número
de "centros de atrapamiento lento".

ofrecer una teoría de la recombinación superficial basada en los niveles de atrapa-


miento asociados con la superficie; pero teniendo propiedades similares a las de los
centros volumétricos que se vieron hasta ahora en lo que respecta a las estadísticas
de captura y emisión.
Desde el punto de vista físico, los centros volumétricos de atrapamiento de los
cristales semiconductores se producen a menudo debido a la presencia de ciertas
'"impurezas de atrapamiento". En semiconductores covalentes, tales como el silicio y
el germanio, estas impurezas de atrapamiento con frecuencia son dobles receptores
divalentes, por ejemplo, Cu y Ni, que proporcionan un nivel receptor ordinario muy
cercano a la banda de valencia- y un segundo nivel profundo dentro de la región
prohibida que se ioniza con mucha menos fa, tlidad y que funciona como un nivel
de atrapamiento. Los niveles donador y receptor originados por la presencia de impu-
rezas de substitución III y V se ionizan casi por completo a todas las temperaturas,
excepto las muy bajas y, por ende, usualmente no desempeñan un papel importante
en los procesos de recombinación. 28 La presencia de imperfecciones estructurales,
sobre todo dislocaciones tipo de borde, han demostrado que también producen niveles re-
ceptores de atrapamiento dentro de la región prohibida que en muchos casos propor-
cionan una contribución importante a la recombinación electrón-hueco.
A veces sucede que en una misma muestra estan presentes dos tipos distintos
de centros de atrapamiento. Por lo general, uno de éstos es el centro normal de
recombinación, como se vio antes; sin embargo, el segundo conjunto de centros de
atrapamiento con frecuencia se asocia con una probabilidad de captura de huecos
muy reducida cuando está lleno de electrones. Esto conduce a un valor muy grande de
r P 0 para esos niveles. Aunque naturalmente se de be repetir el análisis de Schockley ·
Read, tomando en cuenta desde el principio los dos conjuntos de niveles de atrapa·
miento, para describir los detalles de la situación resultante, se ve fácilmente de un
modo intuitivo que lo que debe suceder en principio en una medición de fotocon-
ductividad transitoria como la que se vio en la sección 1O. 7, es que algunos electro-
nes se recombinan a través de los niveles normales de recombinación, en tanto que
otros caen dentro del segundo grupo de trampas. No obstante, en muy poco tiempo,
el proceso de recombinación normal termina con todo el exceso de electrones, ex-
cepto con los que quedaron en el segundo grupo lento de trampas que, a continua-
ción, capturan con lentitud el exceso restante de huecos. El decaimiento de fotocon-

28 Excepto, por supuesto, en lo que pueden influir en la posición del nivel de Fermi.
398 Exceso de portadores en semiconductores

ductividad resultante tiene dos secciones exponenciales separadas, con diferentes


constantes de tiempo, como se puede ver en la figura 10.19. Existe una fase de
recombinación inicial "normal" y una gran "cola de atrapamiento" debida a las
trampas lentas. A veces se presenta una confusión en lo que respecta a la termin~
logia relacionada con este efecto, en el sentido de que la parte inicial "normal" del
decaimiento se cita a menudo como "recombinación" y el decaimiento final lento se
describe como "de atrapamiento". En realidad, las dos fases del proceso están gober·
nadas por el fenómeno de atrapamiento y es más exacto citar al primero com:
debido al atrapamiento normal y el segundo a efectos del atrapamiento lento.

EJERCICIOS
l. Principiando con la ecuación de Boltzmann y suponiendo que se aplica la aproximacié>:t
del tiempo de relajación, demuestre que en un sistema de estado estacionario que contien:
partículas libres en el que existe un gradiente de concentración en la dirección z, se establece w:
flujo de difusión - D(fm/6x). Demuestre que el coeficiente de difusión D es igual a 'llc/3 en donlk
'A es la trayectoria libre media y e es la velocidad térmica media. Puede suponerse que b.
trayectoria libre media A es independiente de la velocidad y que el sistema obedece a la estadir
tica de Maxwell-Boltzmann en equilibrio. Nota: suponga que la función de distribución /(r, v) ;.e
puede escribir en la forma n(r).f(v); esto es razonable si la desviación del estado de equilibrio 1!-'
es muy marcada.
2. Los resultados derivados de los cálculos del problema 1 se aplicaron en el texto a
sistemas de estado no estacionario al igual que a sistemas que conservan dicho estado. Explique
(cualitativamente) en qué circunstancias es permisible esta aplicación.
3. Demuestre que si f(x, t) satisface la ecuación diferencial

n a'J- [- g[
ax' T -a(
entonces, .f(~. t)(~ = x - IJEot, en donde E o =constante) debe ser la solución de

az¡ a¡ f a¡
D ax' - ¡LEo ax - ~ = a, .
4. Se crea una distribución de portadores en exceso de estado estacionario en una muestn
extrínseca tipo n, por medio de una fuente plana de generación en el origen. La difuSIÓ•
resultante y el arrastre de la distribución de los portadores se puede considerar de tipo unidr
mensional a lo largo de la dirección x; la extensión de la muestra en la dirección x es esencial-
mente infinita. Se tiene también un campo eléctrico constante E 0 en la dirección +x. u
densidad de portadores en exceso se mide determinando la corriente inversa de saturación en dOi
puntas de prueba en lugares diferentes, x =a y x = b(b >a). Se desea calcular la longitud de
difusión Lp a partir de la relación de estas dos densidades medidas de los portadores en exceso.
Demuestre que

J (
In Ko In Ko + eE
kT
d) 0

en donde Ko =8p(a)/8p(b) y d =b- a.


5. Principiando con la solución (10.3-32) de la ecuacton de continuidad y definiendo el
tiempo de tránsito como el lapso en el que el trazo del osciloscopio llega a un máximo, derive
los resultados indicados en (10.4-3) y (10.4-4).
6. Estudie un semiconductor uniforme semiinfinito cuya superficie coincide con el plano
yz. El material posee un tiempo de vida volumétrico de portadores en exceso T y existe una
velocidad de recombinación superficial s asociada con la superficie. También se tiene una velo-
cidad de generación volumétrica uniforme y constante de portadores en exceso g' en todos los
puntos de la muestra. Suponiendo que se ha llegado a un estado estacionario, calcule la densidad
de portadores en exceso 8p(x) en todos los puntos dentro de la muestra.
Lecturas recomendadas 399

7. De acuerdo con los resultados del problema 6, demuestre que, a condición de que
D/L <;¡¡; /2 (D =coeficiente de difusión, L =(DT) 1 /2 =longitud de difusión) no se registra una
gran diferencia en la concentración de portadores dentro del volumen o en el flujo difusivo de
portadores hacia la superficie, ya sea que s se considere como C/2 o infinito. Demuestre que esta
condición se puede representar también en la forma L ~-p .
8. Demuestre explícitamente que el conjunto de funciones :cos a.a} con an según la
define (10.7-19), es ortogonal. Encuentre la constante de normalización ya derivada (10.7-22).
9. La constante de decaimiento fotoconductiva observada, relacionada con una muestra
muy gruesa de germanio tipo n(/)0 = 45 cm 2 /seg, f.4, = 1800 cm2 /V- seg) en 500 ¡Jseg. La muestra
se corta en capas de 0.1 cm de espesor, las superficies se atacan químicamente y luego se observa que
la constante de decaimiento fotoconductiva es 300 ¡Jseg. ¿Cuál es la velocidad de recombinación super-
ficial asociada con las superficies atacadas químicamente de las muestras delgadas?
10. De acuerdo con los resultados de la teoría de Schockley-Read para un material con
centros de atrapamiento para los que T no = T po demuestre que el máximo tiempo de vida
posible se produce cuando e¡ está en el punto intrínseco y que, en estas circunstancias, el
tiempo de vida está dado por

[
T=T•o 1 +cosh~
e-e,]
en donde €¡ es la posición del nivel de Fermi para la condición intrínseca.
11. Explique la variación del tiempo de vida e-n función del nivel de inyección Dp para un
material en el que TpO = T no y en donde €t = €v +~. de acuerdo con la teoría Shockley-Read
12. De acuerdo con los resultados y las técnicas desarrolladas en la sección 10.5, demues-
tre que la constante numérica a de las ecuaciones (10.5-8) y (10.5-9) debe tener el valor 3/2.
13. A veces se indica que, puesto que el flujo en equilibrio de partículas a través de un
plano, en una distribución de Boltzmann, es pC/4, la máxima velocidad de recombinación super-
ficial que puede obtenerse (asociada con una superficie de un coeficiente de reflexión igual a
cero) debe ser s =C/4. La expresión (10.5-15) contradice esta conclusión y predice que el
máximo valor que se puede obtener para s es c/2. Señale el error físico de este argumento Y
demuestre que el valor C/2 dado por (10.5-15) es el realmente esperado desde el punto de vista
físico.
14. Considete una barra de germanio extrínseco tipo n con una sección transversal cons-
tante, que se extiende a lo largo del eje x. Se hace fluir una corriente constante en la dirección
x positiva conectando una batería a los extremos de la muestra. Se crea una densidad uniforme
de pares electrón-hueco en exceso en t =O, dentro de la región 1 x <x <x 2 • Esta distribución
de portadores en exceso sufre un arrastre con una velocidad J.LpE 0 en la dirección positiva de x,
de acuerdo con los resultados de la sección 10.2. Utilice sólo argumentos físicos para explicar
por qué la dist•ihución de portadores en exceso se desplaza a la derecha a lo largo del eje + x, a
pesar de que los electrones en exceso dentro de la distribución deben estarse moviendo hacia la
izquierda dentro del campo aplicado. Haga un diagrama que demuestre (esquemáticamente) el
campo interno y la densidad de carga espacial que lo produce. Puede suponer que el tiempo de
vida volumétrico de portadores en exceso es infinito, que la velocidad de recombinación super-
ficial es cero y que la densidad de portadores en exceso es pequeña en comparación con la
densidad de portadores mayoritarios en equilibrio. Nota: principie observando que, debido a la
constancia de la densidad de corriente a lo largo de la muestra y la modulación de la conductividad
por los portadores en exceso, el campo eléctrico debe ser más pequeño dentro del pulso de portadores
en exceso que fuera de él.

LECTURAS RECOMENDADAS
A. Many y R. Bray, "Lifetime of Excess Carriers in Semiconductors," in Progress in Semicon-
ductors, Heywood and Co., Londres (1958), Vol 3, pp. 117-151.
Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N.J.
(1962).
W. Shockley, Electr0'1S and Hales in Semiconductors, D. Van Nostrand Company, Inc., Nueva
York (1950)
R. A. Smith, Semiconductors, Cambridge University Press, Londres (1961).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
CAPITUW 11
Tecnología de materiales y medición
de propiedades volumétricas

11.1 PREPARACION DE LOS MATERIALES SEMICONDUCTORES


DE ALTO GRADO DE PUREZA

En los capítulos anteriores se dijo muy poco respecto a las técnicas químicas y
metalúrgicas relacionadas con la preparación de las substancias semiconductoras de
alto grado de pureza. De igual manera, aunque ya se examinaron con cierto detalle
las propiedades eléctricas de los semiconductores, casi no se han analizado las téc-
nicas experimentales que se utilizan para medir dichas propiedades. En este capítulo
se intentará remediar estas deficiencias aunque, puesto que el propósito principal es
comprender la física de los semic~mductores, será necesario limitarse a un estudio
cualitativo, o cuando mucho, semicuantitativo de los aspectos químicos y metalúrgicos
de la tecnología de materiales.
Se ha demostrado que gran número de substancias presentan las propiedades
características asociadas con los semiconductores, los elementos covalentes tales como
el germanio y el silicio son los más conocidos, los que se comprenden más a fondo
y los que se utilizan más profusamente en la tecnología de dispositivos. Porque entre
todas las substancias semiconductoras, éstas son las que se preparan con mayor
facilidad en forma de cristales únicos de ultra alta pureza, libres de dislocaciones,
vacantes de red y otras imperfecciones estructurales. Los otros semiconductores cava-
lentes pertenecientes al grupo IV de la tabla periódica, el diamante y el estaño a
(gris), son muy difíciles de obtener en forma de cristales únicos grandes de alta
pureza y, por tanto, no se han estudiado tan minuciosamente desde el punto de
vista fundamental, ni se han utilizado en absoluto en la tecnología de dispositivos
electrónicos.
Los compuestos intermetálicos que se forman entre los elementos del grupo Ili
y el grupo V de la tabla pt:riódica, tales como InSb, GaAs, AIP, etc., cristalizan con
la estructura de la zincblenda y forman una serie de materiales semiconductores
cuyas propiedades físicas son muy semejantes, en muchos aspectos a las de los
elementos covalentes del grupo IV. No obstante, estos semiconductores III-V tienen
una naturaleza ligeramente fónica, lo que explica la mayoría de las diferencias en las
propiedades de los compuestos Ili-V y las de los semiconductores covalentes del
grupo IV. La masa efectiva de los electrones de conducción en los compuestos lli-V
por lo general es muy pequeña en comparación con la masa gravitacional m0 , en
tanto que la masa efectiva de huecos no es muy diferente de la gravitacional del
electrón. Por esta razón, de acuerdo con (9.7-7) y (9.11-19), la movilidad de elec·
trones en muestras puras de estos compuestos será muy alta, como también lo será
la relación de movilidad b. En el InSb, en donde este fenómeno es más pronun

401
402 Tecnología de materiales y medición de propiedades volumétricas

ciado, se observan valores de movilidad electrónica que sobrepasan a 50,000


cm2 /V-seg y relaciones de movilidad de casi 100, a la temperatura ambiente. Desa-
fortunadamente, debido a la probabilidad relativamente alta de recombinación radiac-
tiva y a la dificultad de producir cristales de tales substancias que estén libres de
impurezas de atrapamiento e imperfecciones estructurales, los tiempos de vida de los
portadores en exceso en estos materiales son muy cortos (I0- 7 seg o menos) y los
efectos de los portadores en exceso se pueden observar con extrema dificultad. Las
bandas de energía prohibidas asociadas con los diferentes compuestos intermetálicos
III-V aumentan al reducirse las masas atómicas de los elementos constituyentes, en la
misma forma en que las bandas de energía prohibida de los semiconductores del
grupo IV aumentan al ir de Sn a pasando por Ge y Si hasta el diamante. En
consecuencia, InSb, al igual que Sn a, tiene una banda de energía prohibida muy
pequeña, en tanto que InAs, GaSb, GaAs, GaP y AlP tienen, sucesivamente, mayores
anchuras en esa banda. En general, cualquier compuesto III-V tendrá cierta seme-
janza con el semiconductor del grupo IV ubicado en la tabla periódica a la mitad de
la línea que une a los dos constit¡¡yentes del compuesto III-V. Las propiedades
características de los compuestos III-V fueron analizadas por Seraphin 1 empleando
un ingenioso modelo unidimensional (similar al que se usó en el cálculo de Kronig-
Penney) que permite una solución exacta a la ecuación de Schrodinger. A pesar de
las desventajas asociadas con los tiempos de vida muy reducidos de los portadores ~
las dificultades de la preparación de cristales únicos de alta pureza, los compuestos
semiconductores III-V se han usado en gran variedad de aplicaciones técnicas, sobre
todo cuando la alta movilidad electrónica constituye una ventaja.
Además de estas substancias, el carburo de ~Ilicio (SiC), ciertos compuestos
11-VI tales como CdS, CdSe, CdTe, ZnS, PbS, PbSe, PbTe, ciertos óxidos metálicos ~
aun varias substancias orgánicas cristalinas tales como el antraceno, son semicon-
ductores bien conocidos. Sin embargo, con la excepción del carburo de silicio y.
quizás el sulfuro de cadmio, la importancia tecnológica de estos mllteriales ha sido
muy pequeña, por lo que este estudio se referirá principalmente a los elementos cava-
lentes del grupo IV y a los compuestos intermetálicos III-V.
El material inicial para la preparación de germanio de alta pureza es dióxido
de germanio químicamente puro que se obtiene como un subproducto de la fun-
dición y la refinación del zinc. Este material, que se presenta casi siempre en 1::.
forma de un polvo blanco finamente dividido, se coloca en crisoles de grafito de alta
pureza y se reduce a germanio calentándolo entre 600 y 900°C en una corriente de
hidrógeno. La reacción se desarrolla de acuerdo con la ecuación

Después de varias horas, el germanio se obtiene en la forma de un polvo negro


finamente dividido que se funde en una barra larga y angosta de germanio policrista-
lino, elevando la temperatura por encima del punto de fusión, que es 936°C. Por le
general, se incluye un molde o canal con este fin, en la base del crisol de reducción.
El lingote resultante tiene el aspecto metálico plateado que es característico del
germanio. El lingote reduciclo se purifica más todavía mt:!diante la refinación por
zonas. En este proceso, la barra reducida se coloca en un "bote" largo y angosto
hecho de cuarzo o grafito y se desliza a través del horno en forma de tubo en el
que se han creado varias zonas calientes angostas para fundir una parte angosta del
lingote. Cuando se usan botes de cuarzo, estas zonas calientes se pueden crear por
medio de anillos de grafito calentados por inducción de radiofrecuencia o por co-

1 B. Seraphin, Z. Naturforsch, 9a, 5 (1 954).


Preparación de los materiales semiconductores 403

Bobinas de
00000
,..-inducción de rf"'-.... 00000 00000

\ 00000

1 ub o externo Zonas fundidas


del horno

Figura 11.1. Diagrama esquemático del proceso de refinación por zonas para purificar materia-
les semiconductores.

rriente directa; cuando se usan botes de grafito, una parte del mismo bote puede
actuar como susceptor cuando pasa por una bobina angosta de radiofrecuencia. En
cualquier caso, el efecto es fundir una porción del lingote y pasar la zona fundida
continuamente a lo largo de la barra, de un extremo al otro, conforme el lingote se
desplaza por la zona caliente. La atmósfera de hidrógeno se usa para evitar la
oxidación del germanio a altas temperaturas. En la figura 11.1 se ilustra un diagrama
de este proceso.
De acuerdo con la ley de distribución de Nernst,Z en el estado de equilibrio
térmico, un soluto diluido se distribuye entre dos fases disolventes, de manera que la
razón de la concentración del soluto en las dos fases es una constante independiente
de las concentraciones del soluto. Si por el momento se considera que las dos fases
están en equilibrio teniendo una cantidad de soluto en exceso sobre la cantidad que
se puede disolver en equilibrio, y si en ambas fases se forman soluciones ideales, es
obvio que la razón constante de las concentraciones debe ser la razón de las solubili-
dades en equilibrio del soluto en las dos fases disolventes. En el caso del proceso de
refinación por zonas, se puede considerar que existe un estado de equilibrio aproxi-
madamente3 entre el germanio sólido y líquido, que se pueden tomar como dos
fases disolventes, y las impurezas del sistemas actúan (o al menos eso se espera)
como solutos ideales. A continuación, cada soluto se distribuye asimismo entre las
fases sólida y líquida en la razón entre su solubilidad en el sólido y su solubilidad
en el líquido. Esta razón se cita frecuentemente como el valor de equilibrio K para
esa impureza específica. Puesto que la mayoría de los elementos de impureza son
mucho más solubles en la fase líquida que en la sólida, los valores de equilibrio K
para casi todas las impurezas son mucho menores que la unidad. En estas circuns-
tancias, conforme la zona líquida pasa lentamente por la barra sólida, la mayoría de
los átomos de impureza en el fundido se ven rechazados por el sólido en la interfaz,
en donde la región fundida se solidifica para formar nuevamente una barra sólida.
Cuando una sola zona fundida pasa por un lingote largo, los átomos de impureza
tienden a recogerse en el líquido y finalmente se precipitan sólo en el mismo
extremo del lingote cuando la última parte de la zona fundida se solidifica final-
mente. Este proceso de segregación se puede acentuar más todavía repitiendo el
proceso y terminando por pasar muchas zonas fundidas por el lingote. En el límite

2 Véase, por ejemplo, G. N. Lewis y M. R:mdall, Thermodynamics, Nueva York: McGraw-


Hill, 1923, página 234.
3 Por supuesto, estrictamente hablando, el equilibrio se mantiene sólo en un sistema a
temperatura constante, en el que la interfaz sólido-líquido sería la estacionaria. La descripción
anterior no es válida cuando las velocidades de interfaz y los gradientes de temperatura se hacen
demasiado grandes.
404 Tecnología de materiales y medición de propiedades volumétricas

Concentración Concentración
~=K
Cs
C
¡K- Cz -K*

Czor------ C¡o ------::"!----


t-----~Cs t-------lCs
-4--------~---------------.x -4----------~------------.x
Sólido líquido Sólido líquido
Interfaz

(o) Velocidad baja de interfaz ( b) Velocidad alta de interfaz

Figura 11.2. Concentración de impurezas en las fases sólida y líquida cerca de una interfaz
SÓlido-lÍquida dentro de un aparato de refinación por zonas, (a) a una velocidad
baja de interfaz y (b) a una velocidad más alta de interfaz.

de un número infinito de pasos de zona, se logra un perfil restrictivo de concentra-


ción y la purificación más allá de esta etapa no se puede lograr de modo directo.
Sin embargo, si se desea una segregación de impurezas subsecuente, el lingote se
puede sacar del horno, se le quita la porción extrema (que ahora contiene casi todas
las impurezas de la muestra) y la sección restante vuelve a someterse a otra refina-
ción por zonas. En cualquier caso, al concluir con el proceso de refinación por
zonas, la sección extrema del lingote debe eliminarse.
Mientras que para velocidades de interfaz muy lentas la razón de la concentra-
ción de impure7as en el sólido a la del líquido es la razón de las solubilidades en
equilibrio, para mayores velocidades de interfaz, los átomos de impureza que rechaza
el sólido en enfriamiento se concentran cerca de la interfaz más rápidamente de lo
que se pueden eliminar por difusión hacia el interior de la zona fundida, como se
ilustra en la figura 11.2. La concentración real de impurezas c1 cerca de la interfaz.
por tanto es mayor que el valor de equilibrio c10 • El resultado es que se incorporan
más átomos de impureza al sólido que en el caso de la velocidad baja, en donde se
puede mantener una concentración constante a lo largo de la zona líquida por
medio de la difusión. El efecto es el mismo que si el valor de equilibrio K se
substituyera con un valor efectivo K*, en donde

e,
K*= K·--. (11.1-1)
ero

Puesto que la razón c1/c10 se verá afectada por la velocidad de interfaz, y el


coeficiente de difusión de los átomos de impureza en el líquido, K* debe depender
también de estos factores. No obstante, es evidente que si K< 1, entonces K* debe
ser mayor que K. Por lo común, se considera ventajoso trabajar en condiciones tales
que K* sea apreciablemeHte diferente de K, y en estas circunstancias casi siempre es
necesario determinar K* por experimentación.
Se puede demostrar fácilmente 4 que la distribución de impurezas en un lingote
inicialmente uniforme después de pasar por una zona de longitud 1, es

(11.1-2)

4 W. G. Pfann, J. Metals, 4, 747 (1952).


Preparación de los materiales semiconductores 405

en donde eso es la densidad inicial de impurezas y x la distancia a lo largo de la


barra. También se puede demostrar que la distribución limitante a la que se aproxi-
ma después de un gran número de pasadas es

(11.1-3)

en donde,
A = _c.;;,0=-B_L_ (11.1-4)
e8 I. - 1
y
K*=_!!!__
eBL - 1
(11.1-5)

En este caso, L es la longitud total del lingote. Para mayores datos sobre el
proceso de refinación por zonas, el lector debe consultar el artículo de Pfann4 0
una monografía reciente de Hannai. s Es evidente que el proceso de la retinacion por
zonas se puede aplicar no sólo al germanio, sino también a una gran variedad de
otros materiales. En la tabla 11.1 se da una lista de los valores de equilibrio K para
unpurezas que se encuentran comúnmente en el germanio y el silicio. Debe obser-
varse que el boro es la única impureza común cuyo valor de equilibrio K en el
germanio es mayor que la unidad, es decir, que el líquido la rechaza hacia el sólido.
Esta peculiaridad da como resultado la segregación del boro en el extremo de la
cabeza del lingote más que en su cola.
La preparación de silicio altamente puro principia casi siempre con la reduc-
ción del tetracloruro de silicio (SiCl4 ) o el triclorosilano (SiHCh) por medio del
hidrógeno a aproximadamente 11 00°C. La reacción se desarrolla de acuerdo con la
ecuación

SiHC1 3 + H 2 -+ St + 3HCI.

TABLA 11.1
Coeficiente de segregación de Ge y Si6 •7

Impureza K(Ge) K(Si)

p 0.12 0.04
As 0.04 0.07
Sb 0.003 0.002
8 20. 0.68
Al 0.1 0.0016
Ga 0.1 0.004
In 0.001 0.0003

s N. B. Hannay, Proceedinxs of the Jnternational School o( Physics, "Enrü:o Fermi". Curso 22


{Semiconductores). Nueva York, Academic Press, 1963. págs. 341-435.
6 R. N. Hall, J. Chem. Phys., 51, 836 {1953).
7 J. A. Burton, Physica, 20, 845 {1954).
406 Tecnología de materiales y medición de propiedades volumétricas

Silicio
sólido

Zona generador de rf
fundida

Figura 11.3. Representación esquemática del proceso de zona flotante para la purificación d.:-:
silicio.

Todos los reactivos se encuentran en la fase gaseosa a la temperatura a la que


el proceso se lleva a cabo, con la excepción del silicio, que se precipita en un
substrato apropiado. Este substrato puede ser una muestra de un cristal de silicio de
alta pureza, en cuyo caso, la estructura reticular fundamental del substrato se con-
tinúa en la capa precipitada y, entonces, el proce3o de crecimiento se denommJ.
epitaxial. Otra posibilidad es que el substrato sea una varilla delgada de silicio poli-
cristalino que produce un lingote cilíndrico apropiado para la refinación por zonas..
La refinación por zonas del silicio es similar en principio, al proceso usadc
para el germanio, excepto por la complicación de que el silicio fundido se hume-
dece, reacciona y se contamina prácticamente con cualquier substancia conocida que
pueda utilizarse como crisol. Por tanto, es necesario emplear una técnica que nü
requiera un crisol y la más común es el proceso denominado zona flotante. En este
proceso, una varilla cilíndrica de silicio se sujeta verticalmente por ambos extremos ~
se calienta mediante una bobina de inducción de radiofrecuencia acoplada directa-
mente al mismo silicio. Se puede fundir una región angosta del lingote y la tensiór:
superficial del silicio fundido basta para evitar que la zona fundida se derrumbe y se
pierda. A continuación, la zona puede pasarse a lo largo del lingote para segregar
impurezas hacia un extr~mo, y el proceso se puede repetir cuantas veces sea nece-
sario para alcanzar el grado de pureza requerido. En la figura 11.3 se ilustra este
proceso. Se puede reducir el contenido de impurezas eléctricamente activas tanto er:
el germanio como en el silicio hasta una parte en 10 11 Esto es suficiente pan
producir germanio que es intrínseco a la temperatura ambiente; pero no lo suficien-
temente bueno para obtener silicio intrínseco (sería necesario otro factor de
10-100 para lograr esto). El silicio y el germanio con refinación por zonas tiene~
la suficiente pureza para servir como material inicial para una gran variedad de
dispositivos semiconductores.
La preparación de especímenes de alta pureza de los compuestos intermetálicos
lli-V se logra casi siempre fundiendo cantidades estequiométricas de los constituyen-
tes elementales sumamente purificados, en tubos de cuarzo sellados, para prevenir la
pérdida de los volátiles por evaporación. Los lingotes obtenidos se pueden purificar a
menudo de un modo notable mediante la refinación por zonas; pero también en este
caso, la muestra debe confinarse a un tubo sellado. En general, los esfuerzos para
purificar los compuestos Ill-V por el procedimiento de refinación por zonas u otras
técnicas, no han tenido el éxito logrado con materiales del grupo IV.
Crecimiento de muestras monocristalinas 407

11.2 CRECIMIENTO DE MUESTRAS MONOCRISTALINAS

En general, el material producido mediante el proceso de refinación por zonas


es policristalino, a pesar de que es muy puro. Lo que normalmente se desea para las
investigaciones experimentales o los fines tecnológicos, son muestras semiconductoras
de un monocristal que puedan "impuríficarse" intencionalmente con algún elemento
de impureza dado, con el fin de producir un material con un tipo de conductividad
y una resistividad eléctrica específicas. Existen varías formas de hacer crecer mono-
cristales y cada una posee ciertas ventajas para aplicaciones particulares.
Los monocrístales de germanio se hacen crecer por un procedimiento en el que
uno de los extremos de un lingote refinado por zonas se pone en contacto con una
semilla monocristalína, dentro de un bote apropiado. A continuación se forma una
zona fundida entre el cristal semilla y el lingote policrístalino, y se pasa lentamente
hacía abajo del lingote, de tal manera que el recrecimiento se inicia en la semilla y
continúa su estructura cristalina a lo largo del lingote. Sí se escoge la orientación
adecuada de la semilla monocristalína, se puede obtener cualquier orientación crista-
lina deseada dentro del lingote final,' e incorporando pequeñas cantidades de ele-
mentos de impureza a la zona fundida, pueden elaborarse cristales tipo p o n con
cualquier contenido de impureza deseado. Se debe permitir un margen apropiado
para la segregación de impurezas en la interfaz de crecimiento cuando se calcula la
cantidad de impurezas requerida. Puesto que las cantidades necesarias de impurezas
que se deben agregar son casi siempre microscópicas, se acostumbra producir una
aleación de impurificación de germanio puro al que se ha agregado quizá 0.1 ó 0.01
por ciento de la impureza deseada para introducir esta aleación de impurezas al
fundido, en lugar de intentar impurificado de un modo directo. Este proceso es
capaz de producir cristales grandes de germanio con una perfección estructural muy
elevada y se puede usar también con ciertos compuestos intermetálicos, sobre todo
el lnSb; pero no se puede emplear para producir monocristales de silicio, ya que

Salida del cristal


-1

Horno de cuarzo

Soporte --r-E----1
Semilla Cristal
Atmósfera inerte
o vacío --"""""~

Figura 11.4. Representación esquemática del proceso de Czochralski para h·¡cer crecer monocristales
a partir de una fase fundida.
408 Tecnología de materiales y medición de propiedades volumétricas

éste se humedece o reacciona con todos los materiales que pueden utilizarse para
fabricar el bote. Sin embargo, se pueden obtener monocristales de silicio de alta
calidad utilizando una modificación adecuada del proceso de zona flotante.
Otro método que se usa con mucha frecuencia para el crecimiento de mono-
cristales, es la llamada técnica de Czochralski, en el que una semilla monocristalina
con la orientación deseada se sumerge en un fundido preparado a partir de un
material refinado por zonas y con una impurificación apropiada. El suministro de
calor al fundido se reduce y el cristal semilla se extrae lentamente haciéndolo girar
al mismo tiempo, como se indica en la figura 11.4. El diámetro del cristal óbtenido
puede controlarse regulando la velocidad de extracción y el suministro de potencia al
fundido. Un crisol de grafito puede ser satisfactorio para hacer crecer cristales de
germanio; pero se requiere un recubrimiento de cuarzo para el silicio. Aunque el
silicio fundido se humedece y reacciona con el cuarzo, el recubrimiento es atacado
con mucha lentitud y el crecimiento del cristal no se perturba gravemente. Parte del
oxígeno del recubrimiento de cuarzo se puede introducir a los cristales de silicio
obtenidos por esta técnica; pero no es una impureza eléctricamente activa y no
afecta seriamente la calidad del cristal para la mayoría de los fines experimentales o
técnicos. La técnica de Czochralski también se puede usar para hacer crecer mono-
cristales de los compuestos intermetálicos 111-V; pero para estas substancias se re-
quiere casi siempre un sistema cerrado para minimizar las pérdidas de los compuestos
volátiles. La extracción del cristal y la rotación con frecuencia se logran por medio
del sistema sobre armaduras ferromagnéticas del interior.
La posibilidad de hacer crecer epitaxialrnente regiones monocristalinas de silicio
ya se mencionó en conexión con la preparación de dicho elemento mediante la
reducción de fase de vapor de los cloruros. Este proceso es valioso, sobre todo para
hacer crecer regiones planas paralelas de tipos opuestos de conductividad o conden-
sidades de impureza abruptamente variables debido a que estas impurezas se pueden
incorporar (por ejemplo, como, PC1 3 o BC13 gaseosos) en la corriente de gas de
entrada. También se han desarrrollado procesos para adaptar esta técnica al uso del
germanio.
Además, se ha usado el crecimiento dendrítico del cristal para producir cris-
tales apropiados para utilizarlos en la tecnología de dispositivos semiconductores. El
crecimiento dendrítico se produce cuando un cristal semilla se inserta en un fundidc
superenfriado. En estas condiciones se inicia un crecimiento rápido semiforme CU) a
velocidad se determina de la razón a la que se puede alejar el calor latente de fusión
en la interfaz de solidificación. Si el cristal en crecimiento se estira hacia arrriba con
gran rapidez sac:\ndolo del fundido, se puede formar una tira dendrítica de semi-
conductor. Las v'elocidades de crecimiento del orden de 5cm/seg son típicas (er.
comparación con 1o- 3 cm/seg del proceso de Czochralski en el que el fundido nc
está superenfriado). La anchura y el espesor del cristal dendrítico se pueden con-
trolar dentro de ciertos límites, variando el superenfriamiento del fundido y la velo-
cidad con que se extrae la tira del fundido. También es muy posible, en el caso de:
germanio, producir tiras dendríticas de 1 a 5 mm de ancho y de 0.1 a 0.5 mm de
grueso. La longitud está limitada sólo por los arreglos que se puedan hacer pan
extraer la dendrita. Las superficies de los cristales dendríticos son ópticamente planas
y, si se toman ciertas precauciones en su crecimiento, pueden ser fundamentalmente
perfectos desde el punto de vista estructural. La ventaja más evidente del procese
dendrítico es que produce cristales que se pueden emplear directamente como mate-
rial inicial para dispositivos semiconductores, sin necesidad de recurrir a operacione1
de corte, pulido, grabado o ataque con ácidos que, de otra manera, son necesariu.
El espesor de las tiras dendríticamente crecidas se puede controlar de tal modo qut
sea muy uniforme, lo cual tiene gran importancia en muchos procesos de fabricación
de dispositivos. Se pueden producír con facilidad cristales dendríticos muy buenos de
Medición de la resistividad volumétrica 409

germanio, silicio e InSb, y también se ha logrado el crecimiento de dendritas de


otros compuestos intermetálicos III-V; pero con mayor dificultad y con resultados
algo deficientes.

11.3 MEDICION DE LA RESISTMDAD VOLUMETRICA

La medición de la resistividad es la más fundamental de las mediciones de


rutina que se hacen en los cristales semiconductores. Básicamente, cualquier medición
se hace pasando por la muestra una cantidad de corriente conocida con precisión, y
midiendo la caída de voltaje entre dos puntos separados por una distancia conocida.
Sin embargo, existen algunas técnicas específicas que tienen la suficiente importancia
que justifique un estudio más amplio.
Una forma muy exacta de medir la resistividad de un espécimen de semicon-
ductor bastante homogéneo es obtener un potencial transversal de la muestra, ha-
ciendo una serie de mediciones potenciométricas de la caída de voltaje entre un
contacto fijo y una punta de prueba móvil, conforme este último se desplaza a lo
largo de la muestra en pequeños incrementos, casi siempre de 0.5 mm ó 1.0 mm.
En la fJgUra 11.5 se muestra un diagrama de esta medición. Si la distancia entre las
puntas de prueba se incrementa de x a x + Ax, la resistencia t:.R del elemento
pequeño de la muestra que queda entre .X y x + !:u, se suma a la resistencia R de la
porción comprendida entre O y x. Entonces, si la corriente que fluye por la muestra es
10 y si se observa un cambio AV en el potencial entre la punta fija y la móvil que acom-
paña al cambio en el espaciamiento de la punta /:u, por definición de la resistividad,

(11.3-1)

en donde A es el área transversal (constante) de la muestra. Al resolver para p, es


evidente que
AL\ V
p=-- (11.3-2)
lol\x

representa la resistividad del material que queda entre x y x + Ax. Si se hace una
serie completa de mediciones que incluyen incrementos constantes en el espaciamien-

Al potenciómetro (- l
Micrómetro para
r-.-.,.-,¡vuw11l\ proporcionar el
,...L_ __L_L:.::.:..::::__:=::::.:_:_:.:..:::.::::::~=L!-c.....I4Mt.IJJI movimiento
Base calibrado
de la muestra

Figura 11.5. Diagrama del aparato para determinar la resistividad volumétrica por el método del
potencial transversal.
410 Tecnología de materiales y medición de propiedades volumétricas

to de la punta, se puede llegar a una determinación experimental de la resistividad


en función de la distancia a lo largo de la muestra. Esta gráfica a menudo se
denomina perfil de resistividad de la muestra. Debe hacerse notar que, puesto que se
usa un potenciómetro para medir el potencial entre la punta fija y la móvil, no
fluye ninguna corriente entre estos electrodos.
Otra forma muy sencilla, pero menos exacta de medir la resistividad, que con
frecuencia se puede emplear para controlar las especificaciones del material en proce-
sos de elaboración de dispositivos, es mediante la técnica de las cuatro puntas. En
este método, se tienen cuatro puntas de prueba equidistantes que se sitúan sobre la
muestra, como se ilustra en la figura 11.6. El par de puntas que queda al exterior
se usa para hacer pasar por la muestra una corriente uniforme y el par del interior
sirve como probadores de potencial entre los cuales se puede medir potenciométrica-
mente una caída de voltaje. Si se usan los métodos normales de la electrostática y la
teoría de la corriente uniforme, se puede encontrar la distribución de potencial
resultante y, a partir de esta solución, se puede demostrar que la diferencia de
potencial entre las puntas internas debe estar dada por

1
V=- (11.3-3)
2nua

en donde 1 es la corriente uniforme que fluye por las puntas probadoras externas y
a el espaciamiento entre las puntas adyacentes. Por tanto, la resistividad de la mues-
tra es

1 2naV
p=-=--. (11.3-4)
(1 1

Los detalles de la derivación de (11.3-3) quedan asignados como tarea para el


lector. Al obtener esta ecuación se supone una muestra semiinfinita y, por tanto.
estrictamente hablando, (11.3-3) no es válida para muestras de extensión finita. Sin
embargo, si todas las dimensiones de la muestra son grandes en comparación con el
espaciamiento de las puntas, a, el error que representa el uso de (11.3-3) o (11.3-41
será muy pequeño. En estos dos métodos mencionados, las condiciones del experi-
mento deben ser tales que se eviten por completo los efectos originados por la
inyección de portadores minoritarios en los contactos de la corriente. Esto se logra
con mayor facilidad puliendo o usando cualquier otro abrasivo en las superficies de
la muestra para que los portadores inyectados en exceso se recombinen rápidamente

Muestra

Figura 11.6. Diagrama esquemático del aparato de cuatro puntas para medir la resistividad.
Medición del contenido de impurezas 411

cerca de los contactos de la corriente y manteniendo la corriente uniforme lo sufi-


cientemente baja para .:vitar cualquier modulación significativa de la conductividad
mediante los portadores inyectados.
Al hacer las mediciones de resistividad a temperaturas bajas es necesario confinar
la muestra dentro de un crióstato al vacío 1 para evitar la condensación de la hume-
dad atmosférica ambiental en sus superficies. En estas circunstancias, la resistividad
se mide casi siempre de un modo potenciométrico, determinando la caída de voltaje
entre dos contactos fijos a una distancia conocida de separación cuanrlo se pasa una
corriente uniforme a lo largo de la muestra. A continuación la resistividad procede
de (11.3-2) siendo .!lV la caída de voltaje medida y .!lx la distancia entre los
contactos. Todos los métodos analizados aquí se aplican principalmente a muestras
de suficiente homogeneidad; para especímenes en los que las fluctuaciones de resis-
tividad son grandes en distancias pequeñas, se requiere usar técnicas especiales.

11.4 MEDICION DEL CONTENIDO DE IMPUREZAS Y LA MOVILIDAD


MEDIANTE EL EFECTO DE HALL

La teoría del efecto de Hall se estudió en los capítulos 7 y 9, y aquí sólo se


verá un estudio breve de las técnicas experimentales. En los extremos de la muestra
se establecen contactos de corriente grandes, en tanto que se aplican a los lados
pequeñas puntas de prueba o contactos soldados hacia la mitad de la trayectoria de
la corriente, para la medición de potencial. Con frecuencia las técnicas de soldadura
ultrasónica son muy útiles para establecer estos contactos, así como los que se
utilizan para otros fines experimentales. El voltaje de Hall se debe medir potencio-
métricament~> para satisfacer la condición de que la componente y de la corriente
sea cero. Por lo general, las superficies de la muestra se pulen y se usan valores
mínimos de corriente de muestra casi siempre, para evitar, lo más posible, la inyec-
ción de un exceso de portadores a la misma.
Si los contactos de potencial no están perfectamente alineados para que coin-
cidan con los extremos opuestos de la misma línea equipotencial en ausencia del
campo magnético estático, además del voltaje de Hall se deberá medir una caída
óhmica de voltaje proporcional a la corriente uniforme de la muestra. Esta situación
se ilustra en la figura 11.7. El efecto de esta caída óhmica espuria se puede eliminar
haciendo cuatro mediciones por separado; primero con el campo magnético y la
comente uniforme en dirección positiva, luego con el campo magnético positivo y la

Terminal de voltaje
1
---1 Error de alineación
1

Io-

Figura 11.7. Geometría de las muestras usadas para las mediciones del efecto de Hall, mostran-
do el origen de las caídas óhmicas de voltaje debidas a una alineación deficiente
de los con tactos.
412 Tecnología de materiales y medición de propiedades volumétricas

corriente unifonne inversa, a continuación con el campo magnético y la corriente


inversos y, por último invirtiendo el campo y con la corriente positiva. Por tanto, el
voltaje de Hall obtenido es

(11.4-1)

en donde las cantidades entre paréntesis describen la condición de la corriente y el


campo pertenecientes a la medición del potencial. Es evidente que la caída óhmica
se elimina mediante este procedimiento, ya que el voltaje de Hall cambia de signo
tanto con la corriente como con el campo invertidos, en tanto que la caída óhmica
cambia de signos sólo cuando la corriente se invierte. Puesto que el análisis de las
mediciones de Hall es muy difícil para muestras intrínsecas o casi intrínsecas, cuan-
do se trata de muestras que no son extrínsecas a la temperatura ambiente a menudo
se prefiere efectuar las mediciones a temperaturas bajas a las que los especímenes
son definitivamente extrínsecos. Esto se aplica sobre todo cuando el objetivo pri-
mordial es evaluar la densidad neta de átomos de impureza de las muestras. En estas
circunstancias se requiere usar un crióstato al vacío. También se necesita utilizar
valores de campo magnético estático suficientemente bajos para que w 0 T~ 1, en
donde w 0 es la frecuencia de ciclotrón eE0 /m*c, para que sea válido el análisis de
la sección 9.8. La densidad de portadores de la muestra se puede calcular a partir
del voltaje de Hall de acuerdo con los métodos que ya se desarrollaron y describie-
ron en las secciones 7.6 y 9.8. La movilidad de Hall puede obtenerse combinando
los resultados de Hall y la resistividad; este procedimiento se delineó ya en la
sección 9.8.

11.5 MEDICION DEL TIEMPO DE VIDA


DE LOS PORTADORES EXCEDENTES

La medición del tiempo de vida de los portadores en exceso se logra casi


siempre observando el decaimiento de la fotoconductividad transitoria. La teoría de
esta medición se vio detalladamente en la sección 10.7 y no es necesario que se
agregue nada aquí, excepto una breve descripción del aparato.
Se puede utilizar un tubo de arco de gas de xenón a alta presión (como por
ejemplo, el Edgerton, Genneshausen y Grier XP-12) para excitar la fotoconductividad
de la muestra. Este tubo produce una iluminación muy intensa y repentina que dura
aproximadamente 10- 6 seg. El bulbo o tubo puede usarse en combinación con un
sistema óptico para concentrar en la muestra la mayor cantidad de luz posible. Un
arreglo muy aceptable es montar el tubo de "flash" en uno de los focos de un

Reflector Batería de barrido


4000V~~~~~---,
1111~~+---o

~
Fuente de
alimentación
de alto
voltaje
Osciloscopio
t----..._--11---o

Figura 11.8. Representación esquemática para la determinación de los tiempos de vida de los
portadores en exceso a través de las mediciones de fotoconductividad transitoria.
Dislocaciones y otras imperfecciones 413

reflector elipsoidal y la muestra en el otro. El bulbo de "flash" es similar a los que


se utilizan como fuentes lumínicas fotográficas. Se puede operar como un oscilador
de relajación de funcionamiento libre en un circuito como el que aparece en la
figura 11.8, con el fm de obtener "flashes" repetitivos. El decaimiento de la foto-
conductividad se observa en un osciloscopio de banda ancha y los tiempos de vida
se obtienen de las curvas de decaimiento observadas aplicando los métodos que se
vieron en la sección 1O. 7 Este método se re!ftringe a tiempos de vida superiores a
w- 6 segundos, ya que la iluminación del bulbo de "flash" no se corta abrupta-
mente, sino que se pierde con cierta constante de tiempo de este orden de mag-
nitud. Se han desarrollado fuentes especiales de chispa que se pueden emplear para
resolver tiempos de vida algo más cortos.

11.6 DISWCACIONES Y OTRAS IMPERFECCIONES

Las dislocaciones son defectos reticulares en cristales que se pueden compren-


der en función de un deslizamiento interno parcial. Existen dos tipos básicos de
estructuras con dislocación, las de tipo de borde y las de tipo de tornillo. En la
figura 11.9 se muestra el tipo de dislocación de borde. Se puede considerar que este
tipo de dislocación es el resultado de un deslizamiento interno parcial en el plano
ABCD a lo largo de la dirección BC. En la ilustración, la magnitud del deslizamiento
es una distancia interatómica. Se puede pensar que el cristal resultante contiene un
medio plano extra de átomos (ABEF en el diagrama) y está claramente en un estado
de esfuerzo mecánico en la región del borde de dislocación AB tal, que el material
está en tensión por encima del borde de dislocación y en compresión por debajo
de éste.
La dislocación tipo tornillo se ilustra esquemáticamente en la figura 11.1 O. En
esta estructura con dislocación, el deslizamiento se ha desarrrollado paralelamente a
la línea de dislocación, que es normal a la superficie superior del cristal, más que

e - Vector de deslizamiento

,'
..1/
, A

Figura 11.9. Diagrama esquemático de un cristal que contiene una di~locación tipo borde. La
dislocación se puede considerar como producida por un deslizamiento que repre-
senta un espaciamiento de red en la dirección BC. Puede pensarse que el cristal
contiene el "plano adicional" de átomos, ABEF.
414 Tecnología de materiales y medición de propiedades volumétricas

Vector de
deslizamiento

Figura 11.10. Representación esquemática de una dislocación tipo tornillo.

perpendicular a la línea de dislocación, como sucede en el caso de la dislocaciór:


tipo borde. En realidad, las dislocaciones de borde y tomillo pueden considerarse
como diferentes aspectos del mismo fenómeno de deslizamiento interno, como se
indica en la figura 11.11, que es una vista del cristal que aparece en la figura 11.9
con una región de deslizamiento interno de distinta forma. En este caso, la mismé
línea de dislocación (representada siempre por el símbolo 1) es normal al vector de
deslizamiento en la cara frontal del cristal, como en una dislocación de borde, ~
paralela al vector de deslizamiento en un lado, como en la dislocación de tornillo.
Quizá sea más exacto decir que la dislocación posee una orientación de borde en e:
frente y una orientación de tornillo lateral, aunque no se usará aquí rigurosamente
esta terminología.
Las dislocaciones se forman en las etapas iniciales del crecimiento del cristal ~
son responsables de muchas propiedades que se observan en los cristales. En realidad.

fTornillo

/Vector de
deslizamiento
¡..___,,__.

Figura 11.11. Cristal que contiene una región de deslizamiento que origina una dislocación que
tiene, en parte, una orientación de tornillo y, en otra, una orientación de tipo
borde.
Dislocaciones y otras imperfecciones 415

la mayoría de las características observadas del crecimiento del cristal a partir de un


fundente líquido de una solución supersaturada o de una fase de vapor, están gober-
nadas por las dislocaciones en los cristales de crecimiento más que por cualquier otra
propiedad de la red cristalina perfecta propiamente dicha. La razón de esto es que
los átomos de las fases líquida o de vapor están enlazados a una cara creciente del
cristal con mayor fuerza en un "escalón" en el que termina una capa incompleta de
átomos, que en un sitio aislado en la cara del crecimiento. Esto es cierto porque en
el escalón, un átomo que entra puede unirse a dos átomos de la red cristalina más
bien que a uno sólo. En la figura 11.10 se ilustra esta situación. Por tanto, el
crecimiento procederá con mucha mayor rapidez (o con la misma rapidez a un nivel
mucho más bajo de saturación o subenfriamiento en la fase líquida o sólida) en una
cara de escalón que en una superficie plana completa y estructuralmente perfecta. La
formación de un escalón en un cristal estructuralmente perfecto mediante la coales-
cencia de varios átomos aishdo~ que se depositan de un modo aleatorio de la fase
líquida o de vapor, es no obstante un suceso de muy escasa probabilidad, ya que
tales átomos no están fuertemente unidos a la cara del cristal y, por lo general, no
se unen a él el tiempo suficiente para enlazarse y formar un escalón de crecimiento;
por lo contrario, casi siempre se sueltan por agitación térmica antes de que esto
pueda ocurrir. Cuando se forma un escalón de esta manera, se extenderá con gran
rapidez a través de la cara del cristal mediante la adición de átomos en los bordes,
en donde se unen con gran fuerza hasta que se haya agregado una nueva capa
atómica. Entonces, el crecimiento posterior procede sólo con gran dificultad, ya que
ahora se debe formar un nuevo escalón sobre la capa añadida.
Sin embargo, la situación es totalmente diferente si el cristal contiene una
dislocación de tornillo, como se ilustra en la figura 11.1 O. La dislocación de tornillo
proporciona un escalón autoconstruido que no se puede eliminar nunca de la cara de
crecimiento mediante la adición subsecuente de átomos. Cuando los átomos se agre-
gan a una velocidad constante al escalón asociado con una dislocación tipo tornillo,
como la que s~ ilustra en la figura, todas las partes del escalón obtienen la misma
veloddad de crecimiento lineal constante. Esto produce una velocidad angular de
crecimiento respecto del centro, que es mayor cerca de la dislocación que lejos de
ésta, y el escalón tiende a tomar una forma espiral arrollándose alrededor de la
dislocación central. Estas configuraciones espirales escalonadas se observan con fre-
cuencia en cristales en crecimiento y proporcionan una evidencia directa de que éste
constituye un mecanismo importante de crecimiento. 8 Sólo estos pequeños núcleos
cristalinos formadQs en un fundido ligeramente subenfriado o en una solución super-
saturada, que contienen dislocaciones, son capaces de crecer a un tamaño macros-
cópico antes de separarse por agitación térmica. Los procedimientos de crecimiento
que se pueden observar en muestras cristalinas ordinarias son procesos que se asocian
con la presencia de dislocaciones de tornillo.
Cuando se aplican esfuerzos a cristales que contienen dislocaciones, se puede
mover la dislocación dentro de ellos. Por ejemplo, si se aplica un esfuerzo cortante
proveniente de una fuerza dirigida hacia la izquierda y aplicada a la parte superior
de la muestra, y una fuerza a la derecha en la parte inferior, en el cristal de la
figura 11.9, la línea de dislocación AB puede desplazarse hacia la izquierda a través
del cristal. Aunque un estudio completo de la mecánica de las dislocaciones está
fuera del alcance de este estudio, casi todas las propiedades mecánicas de cristales
macroscópicos, incluyendo los módulos elásticos, la deformación plástica y por desli-
zamiento, el endurecimiento con aleaciones y tratamientos térmicos, las propiedades

8 Por supuesto, para ser observables incluso al microscopio electrónico, el vector de desliza-
miento de la dislocación de tornillo asociada con estas "espirales de crecimiento" deben exten-
derse muchas veces sobre la dimensión de la célula unitaria.
416 Tecnología de materiales y medición de propiedades volumétricas

Figura 11.12. Resolución de un desajuste atómico de una frontera de grano con ángulo
pequeño, mediante la formación de una hilera de dislocaciones tipo borde.

de templado y endurecimiento por trabajo, se pueden explicar en función del movi-


miento de las dislocaciones y la interacción de éstas mismas, así como con los
átomos de impureza.9 • 10
La formación de fronteras de grano y las regiones de material estructuralmente
imperfecto, asociadas con las fronteras de grano, se pueden estudiar también de
acuerdo con las dislocaciones. En particular, el desajuste entre los planos cristalinos
que se producen en una frontera de grano de ángulo pequeño se puede resolver a
través de la formación de una hilera de dislocaciones tipo borde en dicha frontera, 11
como se ilustra en la figura 11.12. Este tipo de frontera de cristal se denomina a
veces frontera lineal de Burgers.
La presencia de dislocaciones tipo borde en cristales semiconductores se detecta
fácilmente con ataques químicos en la superficie cristalina utilizando ciertos reac-
tivos. Puesto que la red cristalina alrededor de la dislocación ya se encuentra en un
estado de deformación, se requiere menos energía para romper la red en ese punto
que en cualquier otra parte. Como resultado de esto, el ácido ataca la superficie
cristalina con mayor rapidez cerca de las dislocaciones formando pozos claramente
visibles al microscopio que marcan la intersección de las dislocaciones de borde con
la superficie del cristal. En la figura J 1.13 se muestra una fotografía con pozos
atacados con ácido en las dislocaciones asociadas con una frontera de grano de
ángulo pequeño en el germanio. Estas fotografías proporcionan una verificación expe-
rimental sorprendente de la representación de una frontera de ángulo pequeño que
se muestra en la figura 11.12, ya que el ángulo de desajuste entre las dos secciones
del cristal se puede calcular a partir del espaciamiento entre los pozos y determi-
narse experimentalmente a través de mediciones de difracción de rayos X. Por tanto,

9 W. T Read, Dislocations in Crystals, Nueva York: McGraw-Hill, 1953.


10 A. H. Cottrell, Dislocations and Plastic Flow in Crystals. Nueva York: Oxford, 1953.
11 J. M. Burgers. Proc. Phys. Soc. (Londres) 52, 23 (1940).
Dislocaciones y otras imperfecciones 417

Figura 11.13. Dislocaciones tipo borde en una frontera de grano con un ángulo pequeño en un
cristal de germanio, tal como las descubren un ataque químico. La amplificación
es aproximadamente 600X ..[Fotografía del autor.]

los dos valores obtenidos concuerdan invariablemente de un modo muy aceptable. 12


En la figura 11.13 se pueden observar también algunos pozos atacados con ácidos
que se originaron por la presencia de dislocaciones aleatorias. En cristales de silicio
se pueden observar directamente las líneas de dislocación mediante la difusión de
cobre en la muestra, y luego observando microscópicamente el interior del cristal
utilizando luz infrarroja de una longitud de onda que sobrepase apenas el borde de
absorción. 13 Se emplea un bulbo convertido de imagen para hacer que el ojo pueda
captar la imagen infrarroja. El cobre, que es opaco a la radiación infrarroja, se
precipita a lo largo de las líneas de dislocación formando trazos oscuros que mar·
can el curso de dichas líneas.
La presencia de dislocaciones en cristales semiconductores también da origen a
ciertos efectos eléctricos. Por ejemplo, en el caso del germanio, parece que las
dislocaciones tipo borde introducen niveles receptores que se localizan a una gran
profundidad, aproximadamente 0.2 eV de energía por debajo del borde de la banda
de conducción. 14 • 15 Además algunas investigaciones independientes han demostrado
que las dislocaciones tipo borde actúan como centros de recombinación en el ger-
manio, y de hecho, el tiempo de vida de los portadores en exceso en germanio de
alta pureza casi siempre tiene un límite marcado por la dislocación.16, 17 La situa-

12 F. L. Vogel y colaboradores, Phys Rev., 90. 489 (1953).


13 W. C. Dash, J. Appl. Phys., 27, 1193 (1956).
14 G. L. Pearson, W. T. Read y F. J. Morin, Phys. Rev., 93, 666 (1954).
15 W. T. Read, Phil. Mag., 45, 775 (1954).
16 J. P. McKelvey, Phys. Rev., 106, 910 (1957).
17 G. K. Wertheim y G. L. Pearson, Phys. Rev., 107, 694 (1957).
418 Tecnología de materiales y medición de propiedades volumétricas


• • • • •• • • • • • • •
• • • • • • • • • • •
• • • • • • • • • • • •
• • • • • • • • • • •
• • • • • • • • • • • •
• • • • • • • • • • • •
(a) ( b)

Figura 11.14. Defecto (a) de Frenkel y (b) de Schottky en una red cristalina.

c1on en el silicio y otros semiconductores no se ha investigado con la misma minu-


ciosidad debido a las dificultades técnicas; pero se supone que el caso es similar.
Otro ejemplo importante de una imperfección estructural es la vacante de red.
Existen dos tipos básicos de vacantes de red denominados defectos de Frenkel y
defectos de Schottky, como se ilustra en la figura 11.14. En la formación de un
defecto de Frenke1, un átomo de la red cristalina se desplaza a una posición intersti-
cial dejando una vacante de red tras él, en tanto que para formarse un defecto de
Schottky, uno de los átomos de la región cercana a la superficie se pasa a un sitio
de la superficie dejando tras sí una vacante móvil que luego puede difundirse hacia
el interior del cristal. Existe una energía de activación asociada con la formación de
cualquier defecto de esta índole y, dado que la energía térmica disponible para
contrarrestar la barrera de activación es mayor a alta temperatura, la concentración
de equilibrio de las vacantes aumenta con ésta. Se cree que los defectos de Schottky
predominan en el germanio y en el silicio. Si el cristal se enfría repentinamente
desde una temperatura alta, se puede "congelar" en el interior una concentración de
vacantes por encima de la concentración de equilibrio a temperatura ~biente. El
papel de las vacantes de red en la difusión de átomos de impurezas de substitución.
desde la superficie hasta el interior de la red cristalina, tiene gran importancia. La
presencia de vacantes de red permite que los átomos de la estructura reticular (al
igual que los de impureza) emigren de un sitio de la red dentro del cristal a otro, y

o o o o o o o o o o o o
o o o o o o o o o o o

• • • • • • • o • • •
• • • • • • • • • • • •
• • •(a)• • • • • • • • •
( b)
o o o o o o o o o o o o
o o o • o o o
•o o o o

• • • •
o
• • • • •o
• • • • • • • • • • •
• • • • • • • • • • • •
(e) ( d)
o o o o o o
oooeoo

• • • • •
• • o • • •

• • • • • •
(e)

Figura 11.15. Interdifusión en una interfaz entre dos substancias diferentes, originada por el
movimiento de una vacante de red. Etapas sucesivas en el proceso de difusión.
de (a) a (e).
Dislocaciones y otras imperfecciones 419

con esto se efectúa el transporte por difusion de átomos de impureza superficiales


hacia el interior. Este proceso se ilustra en la figura 11.15. La mayoría de las
características importantes de la difusión de impurezas de substitución en cristales
semiconductores, incluyendo la magnitud de los coeficientes de difusión y su depen-
dencia en relación a la temperatura, concuerdan con el mecanismo de las vacantes.

EJERCICIOS
l. Derive las ecuaciones (11.1-2) a (1 1.1-5) a partir de las consideraciones fundamentales.
2. Se desea hacer crecer un monocristal de germanio tipo p con una resistividad de 2 a 5
ohms-cm mediante la técnica de Czochralski. Como material inicial se utilizarán 500 g de
germanio intrínseco refinado por zonas. ¿Qué cantidad de aleación de impurificación compuesta
de germanio que contiene 0.1 por ciento de galio atómico debe agregarse al fundente para que
la resistividad a la temperatura ambiente de la parte del cristal que crece iniciahnente sea 5
ohms-cm? Se puede suponer que el coeficiente de segregación apropiado es el de equilibrio que
se da en la tabla 11.1. ¿Cómo variará la resistividad del cristal así obtenida en función de su
longitud?
3. Use la teoría electrostática y de corriente uniforme, suponiendo una muestra
semünfinita homogénea e isotrópica, para derivar la ecuación (11.3-3) para el aparato de rt>sistividad
de cuatro puntas. Demuestre explícitamente que la solución satisface todas las condiciones necesarias
de frontera. Nota: Principie tomando en cuenta el campo electrostático creado por una carga
positiva puntual y una carga negativa puntual en el espacio libre.
4. Una frontera lineal de Burgers en un cristal cúbico simple crea una línea de pozos
atacados con ácido, con un espaciamiento de 2 X 10-4 cm, cuando el cristal se ataca química-
mente. Suponiendo que la constante de red del cristal es 4 X 10-8 cm, encuentre el ángulo de
desajuste entre las secciones del cristal en los lados opuestos de la frontera lineal.
5. Una punta metálica de prueba establece contacto con un cristal semiconductor semünfi-
nito de una conductividad constante a. Se hace pasar una corriente constante conocida, / 0 , por la
punta hacia el semiconductor. Suponiendo que la interfaz entre la punta de prueba y el semicon-
ductor es una semiesfera de radio a que se extiende dentro del semiconductor, en donde el
centro queda en el plano de la superficie del semiconductor y que no se inyecta un exceso de
portadores a través de la punta, calcule la impedancia (resistencia de dispersión) del contacto.

LECTURAS RECOMENDADAS
W. Bardsley, "The Electrical Effects of Dislocations in Semiconductors," en Progress in Semicon-
ductors, Vol. 4, Heywood and Co., Londres (1960), p. 155.
A. H. Cottrell, Dislocations and Plastic Flow in Crystals, Oxford University Press, Nueva York
(1953).
l. G. Cressel y J. A. Powell, "The Production of High Quality Germanium Single Crystals," en
Progress in Semiconductors, Vol. 2, Heywood and Co., Londres (1957), p. 137.
P. Haasen y A. Seeger, "Plastische Verformung von Halbleitern und ihr Einfluss auf die Elek-
trische Eigenschaften," en Halbleiterprobleme, Vol. 4, Friedrich Vieweg and Sohn, Braun-
schweig (1958), p. 68.
N. B. Hannay, "Semiconductor Chemistry," en Proceedings of the lnternational School of Phy-
sics, "Enrico Fermi" Course 22 (Semiconductors, Academic Press, Inc., Nueva York
(1963), p. 341.
w. G. Pfann, "Techniques of Zone Melting and Crystal Growing," en Salid State Physics, Ad-
vances in Research and Applications, Vol. 4, Academic Press, lnc., Nueva York (1957),
p. 423.
W. G. Pfann, Zone Melting, John Wiley & Sons, Nueva York (1958).
W. T. Read, Dislocations in Crystals, McGraw-Hill Book Co., Inc., Nueva York (1953).
W. Schockley, J. Holloman, R. Maurer y F. Seitz (editores), lmperfections in Nearly Perfect
Crystals, John Wiley & Sons, Nueva York (1952).
R. K. Willardson y H. L. Goering (editores), Compound Semiconductors, Vol. 1, Reinhold Pu-
blishing Corporation, Nueva York (1962).
Teoría de las uniones p-n de
los semiconductores

12.1 LA UNION p-n

En capítulos anteriores se trató exclusivamente de los semiconductores que se


suponían uniformes u homogéneos en cuanto a la densidad de átomos de impureza
contenidos en su interior. Ahora se centrará la atención en el estudio de substancias
dentro de las cuales la densidad de impureza puede variar de un punto a otro y, en
particular, en muestras que contienen una región extrínseca tipo n y una región
extrfuseca tipo p separadas por una zona de transición relativamente angosta. Esta
región angosta de transición se denomina unión p-n y con ella se asocian propie-
dades físicas sorprendentes que, aunque tienen interés específico desde un punto de
vista puramente fundamental, poseen una importancia primordial, ya que constituyen
la base de operación de la mayoría de los dispositivos electrónicos semiconductores.
A continuación se estudiará un cristal semiconductor que contiene una unión
p-n. La transii:ión entre las regiones tipo p y n puede ser abrupta, en cuyo caso se
encuentra unl!. región que contiene una concentración neta más o menos constante
de impurezas donadoras junto a otra que posee una concentración neta más o menos
constante de receptoras. Por otro lado, la unión puede ser graduada, en cuyo caso,
N d y Na son funciones de la distancia a la unión en dirección de la normal, donde
Nd decrece gradualmente empezando con un valor grande y Na aumenta en la
misma forma a partir de un valor pequeño, conforme se acerca a la unión desde el
lado tipo n; las dos cantidades se igualan en la unión y Na sobrepasa a Nd en el
extremo de la unión dentro de la región p. Estos dos casos se ilustrat'l en la
figura 12.1. En este estudio, el mayor énfasis se dará a las uniones abruptas, ya que
son mucho más sencillas de analizar matemáticamente, puesto que ilustran la mayo-
ría de las características importantes relacionadas con el comportamiento de las
uniones p-n en general y, ya que, para la mayoría de dispositivos más importantes,
la representación aproximada de la unión abrupta es aceptable. No obstante, debe
hacerse notar que en muchos casos la uniones p-n de las estructuras de dispositivos
semiconductores (sobre todo las que se producen una conductividad tipo n o p en
un substrato de conductividad opuesta) son uniones graduadas. Se intentará señalar
cualitativamente por lo menos, las diferencias existentes entre las conducta física de
las uniones abruptas y graduadas, siempre que se presente la ocasión.

421
422 Teoría de las uniones p-n de los semiconductores

----------~~------------ --x
tipo-n tip01J ti po-n tipo-p
Unión Unión
(a) (b)

Figura 12.1. Concentraciones de átomos de impureza en la cercanía de (a) una unión p-n
abrupta y (b) una unión p-n graduaL

Supóngase que de alguna manera se forma instantáneamente una unión abrupta


p-n juntando una muestra uniforme tipo p con otra tipo n 1 para formar un solo
cristal. En el instante de formación existe una concentración uniforme nno de elec-
trones libres móviles y Pn 0 de huecos libres móvibles en el lado n, extendiéndose
hasta la unión, y en el lado p, una concentración uniforme Ppo de huecos móviles y
npo de electrones libres que se extiende también hasta la unión. Estas concentra-
ciones están relacionadas con las densidades netas de donadores y receptores Nd y
Na por medio de {9.5-23) y {9.5-24), en tanto que en ambos lados las densidades de
electrones y huecos satisfacen la relación
(12.1-1)

Puesto que la concentración nn 0 de electrones del lado n es mucho mayor


que la concentración de electrones npo del lado p, en el instante de formación
existe un gradiente enorme en la concentración de electrones en la unión entre
ambas regiones. La misma situación existe con respecto a la concentración de hue-
cos en la misma unión. Los grandes gradientes iniciales de concentración estable-
cen corrientes de difusión que hacen que los electrones de la región n y los huecos
de la región p fluyan descendiendo por los gradientes de concentración respectivos
hasta la región de conductividad de tipo opuesto y dejando a la región cercana a la
unión, vacía de portadores mayoritarios. No obstante, este flujo de difusión inicial
no puede continuar indefinidamente, debido a que en las regiones cercanas a la
unión hay deficiencia de portadores mayoritarios, las cargas de los iones fijos dona-
dores y receptores cercanos a la unión ya no están balanceadas por las cargas de los
portadores libres móviles que estaban allí inicialmente, de modo que se establece un
campo eléctrico. La dirección de este campo eléctrico es tal que se opone al flujo
de los electrones que salen de la región n y al flujo de los huecos que salen de la
región p, y la magnitud de campo se desarrolla hasta el punto en que su efecto
contrarresta exactamente la tendencia de los portadores mayoritarios a difundirse.
descendiendo por la "pendiente" de concentración hacia la región de conductividad

1 La formación de una unión de esta manera es sólo un experimento imaginario y no


puede efectuarse en la práctica. La estructura de la unión p-n debe existir como un monocristal
casi perfecto y sólo se puede obtener impurificando debidamente el fundente "contraimpurif¡.
cándolo" (o agregándole impurezas de otro tipo), conforme va creciendo el cristal o bien.
utilizando alguna difusión especial o proceso de aleación con que se logre prácticamente el
mismo resultado.
La unión p-n 423

tipo-p Unión tipo-n


1
EB 1 EB
+e e +e+ e 1 e e 1
e +e +e e+ 1 e 1 EB
~ + + e 1 Carga EBI
+ 'é +e e+ e 1-espac!al EB IEB EB -
e+ l negativa Carga __j
e + + e e EBespacial
EB
+e
ee 1 e
+ + + + ¡e e positiva 1
EB EB 1
e e e e ~1 e 1 EB ' EB
e+e+e; e le Cam~o ehfctrico
e+ e+ + 1 e EBI
e+ e + e EB EB 1
+ + + e +e 1 e e
e e + 1 IEB
+ e+e++e e le ee 1 - EB
e+ e +¡e e EB ¡-EB
e + + e e ¡e 1
+ + e e+ + e
e ee + ee 1 e 1
+ ¡e EB JEB-
++ee+e e
+ 1 e EB J

<i> Iones fijos de impurezas donadoras - Electrones libres


e Iones fijos de impurezas receptoras + Huecos libres

Figura 12.2. Diagrama que ilustra la formación de las capas de carga espacial y el campo
eléctrico interno mediante la difusión de portadores mayoritarios cerca de una
unión hacia la región con un tipo de conductividad opuesta.

opuesta. Entones se establece una condición de equilibrio dinámico en la que la


región cercana a la unión queda vacía de portadores mayoritarios y en la que
forman fuertes capas de carga espacial que contienen campos eléctricos altos cerca
de la unión. Esta situación se ilustra en la figura 12.2 y, de acuerdo con ella, es
evidente que la configuración de carga espacial es una caplt dipolar eléctrica con
iones donadores no compensados en el lado n y iones receptores no compensados en
el lado p, proporcionando los componentes de carga positiva y negativa respectiva-
mente.
Uno de los resultados más conocidos de la electrostática es que se produce una
diferencia de potencial entre los dos límites extremos de una capa dipolar eléctrica,
que se relaciona con la intensidad (momento dipolar por unidad de área) de la capa
mediante

(12.1-2)

en donde r/> 1 y r/> 2 son los potenciales de borde y .d es la intensidad de la capa


dipolar. Por supuesto, más allá de las regiones de la carga espacial no existe una
densidad de carga y, por tanto, el potencial electrostático es constante. De acuerdo
con (12.1-2), la energía potencial de un electrón "en reposo" situado en la base de
la banda de conducción es 41Te .d menor en un lado de la unión que en el otro. Se
puede formular el mismo enunciado para un hueco "en reposo" que esté en la parte
superior de la banda de valencia. Sin embargo, puesto que el estado del sistema es
de equilibrio térmico, la energía de Fermi e¡ debe ser la misma en todo el sistema.
Estas consideraciones permiten describir las bandas de energía abrupta tal como se
424 Teoría de las uniones p-n de los semiconductores

fEnergfa potencial de electrones


1
••p _ _ _ _ _ _ _ _ ;;;__+___ 1
1 1
1 - 1- -- -
----------------t-.. 1 ',
- -- ----- ~ t:n

•, ... 1 •,-x
•rp +++ ++ +++++++ +++ + + 0._--~------,-------
+ ++ + + + + +1 + + -e </>(X)
+ +
+
+ 1
+ : 1
---------:----
+ + +
~-+-1
+ •••
--r--sc- +sc+-
Unión
tip01) ti po-n
(Densidad de receptores N0 ) (Densidad de donadores Nd)

Figpra 12.3. Diagrama de la energía potencial en el que se muestra la configuración de bandas


de energía cerca de la unión p-n en ausencia de un voltaje aplicado.

ilustra en la figura 12.3. Evidentemente, existe un "potencial de contacto interno··


e(cp 2- cp 1 ) = ecp0 desarrollado entre las dos regiones. En esta misma figura se pueden ver
claramente las tendencias de oposición de los gradientes de concentración y los campos
eléctricos; los electrones <k: la banda de conducción del lado n se difundirían obvia·
mente descendiendo por el gradiente de concentración lado p, si no fuera por la
"pendiente" del potencial eléctrico que deben vencer para lograrlo.

12.2 EL POTENCIAL DE CONTACTO INTERNO DE EQUILIBRIO

El valor del potencial de contacto interno cf>o se determina fácilmente a partir


de los valores de la densidad de electrones (o huecos) en equilibrio a ambos lados
de la unión, lejos de las regiones de carga espacial. De acuerdo con (9.3-6), se puede
escribir
(12.2-1)

para la densidad de electrones en el lado n y, para la densidad del lado p,


(12.2-2)

De ~stas ecuaciones se pueden despejar €en y ecp y la diferencia de energía


potencial interna ecp 0 , que, como se puede ver claramente en la figura 12.3 no es
más que la diferencia entre las dos, por lo cual está dada por
n.o
el/> 0 = ecp - ec• = kT ln-. (12.2-3)
npo
Esto se puede escribir de un modo diferente utilizando (12.1-1) para expresar
npo en función de Ppo, como
,~, _ kT 1 n.oPpo
'I'O- n 2 ·
(21.2-4)
e 11¡
El potencial de contacto interno de equilibrio 425

Si todos los donadores y receptores de las regiones n y p están ionizados,


como lo estarán a todas las temperaturas, excepto las muy bajas, y si las dos
regiones p y n son fuertemente extrínsecas, entonces, de acuerdo con (9.5-25) y
(9.5-26) nno ~Na y Ppo ~Na, por lo cual, (12.2-24) se convierte en

( 12.2-5)

La aplicabilidad de estas fórmulas está evidentemente limitada a situaciones en


que las estadísticas de Boltzmann se pueden utilizar para describir la distribución de
equilibrio de los portadores, tanto en la región p, como en la n.
A continuación se examinará lo que sucede cuando se aplica un voltaje externo
a la muestra que contiene una unión p-n. Es obvio que, puesto que las regiones de
carga espacial a ambos lados de la unión tienen una deficiencia de portadores, estas
regiones poseen una resistividad mucho mayor que cualquier otra parte del cristal.
Esto significa que cuando se aplica una fuente de voltaje externo a la muestra en
que se tiene una región p-n, como sucede en la figura 12.4, casi toda la caída de
voltaje se producirá en estas regiones. Prácticamente en todas las condiciones, excep-
to aquellas en las que se aplica un voltaje grande con la "polaridad en directo" que
se indica en la figura 12.4(a), las caídas de voltaje en las regiones uniformes n y p
que quedan fuera de las capas de cargas espacial cerca de la unión, son despreciables
en comparación con la caída que se registra en la región de la unión misma. Si la
unión p-n se usa como rectificador, se obtiene una condición de baja impedancia
cuando la región n se conecta a la terminal negativa y la región p a la positiva de la
fuente externa de voltaje, como se señala en la figura 12.4(a). Esta polaridad se
conoce como estado de polarización directa. Se acostumbra considerar que el signo del
potencial externamente aplicado en este caso es positivo. En la figura 12.3 se ve
claramente, que cuando se aplica el voltaje externo en esta forma, el efecto es
reducir la altura de la barrera de potencia. como se muestra en la figura 12.4(a). Si
la caída de voltaje en las regiones volumétricas n y p que quedan fuera de la capa de
carga espacial es despreciable en comparación con la que se produce en la unión, la
altura de la barrera intensa será e(!/Jo - V0 ) en donde V0 es el voltaje externo. Si se
invierte la polaridad de la fuente de potencial externo (en cuyo casos su signo se oonside·
rará negativo), se observa claramente en la figura 12.3, que la altura de la barrera de po-

~
y~
V0 (Positivo) e (1(>0 -1{¡)
~ V0 (Negativo) eof>o

- -~,
----!---- -~ ----1---
"'-. Con el potencial
. '' L
'------ aplicado ' ... _ --"'10.
'Aplicando
f ............_____ potencial
eof> ~
____¡~ ___ )~""----- Aplica~d1o
t- potenc1a
Sin aplicar
potencial
(O) (b)

Figura 12.4. Diagrama de la energía potencial que presenta el efecto de (a) un voltaje de
polarización directa y (b) de polarización inversa en la configuración de bandas de
energía en una unión p-n.
426 Teoría de las uniones p-n de los semiconductores

tencial interno se ha incrementado como se ilustra en la figura 12.4(b ). Si la caída entre


las regiones n y p que quedan fuera de la unión se desecha en comparación con la caída en
las regiones de carga espacial de la unión, también es obvio que la altura de la barrera se
puede representar como e(tf>o - ~0 ) en donde Voz es ahora una cantidad negativa. En
estas circunstancias, como se verá detalladamente más adelante, la estructura presenta
una independencia muy alta y se dice que el voltaje aplicado es una polarizadór:
inversa.

12.3 POTENCIALES Y CAMPOS EN LAS CERCANIAS


DE UNA UNION p-n

Ahora se verá el modelo general de una unión p-n como la que se ilustra en la
figura 12.5. Como se ha representado en esta figura, existe un voltaje aplicado V 0
(negativo en el dibujo) al igual que un potencial interno t/> 0 . En estas circunstancias.
se tendrán flujos de corrientes eléctricas y el estado del sistema ya no será de
equilibrio térmico. Por esta razón, no se puede definir ya un nivel único de Fenm
para todo el cristal. Sin embargo, se supondrá que lejos de la unión prevalecen las
condiciones de equilibrio y que las densidades de huecos y electrones en esos puntos
se pueden describir mediante las distribuciones de Fermi relacionándolas con los dos
niveles de Fermi E¡no y E¡po· Por supuesto, si no se aplica un voltaje, el sistema
estará en equilibrio y E¡no y E¡po serán equivalentes; pero como están las cosas, es
obvio, de acllerdo con la figura, que deben diferir en eV0 • Cuando se aplica un
voltaje a la unión, resulta que, como se demostrará sin lugar a dudas más adelante.
la concentración de portadores minoritarios en las regiones n y p contiguas a las
capas de carga espacial se ven seriamente perturbadas en sus valores de equilibrio, en
tanto que la concentración de portadores mayoritarios se ven muy afectados en lo

-e4>(x)

<cp-----------~ Densidad de donadores Nd (xl

.,P(x)
T
'fpo
f~p
-......._:---------"""T"--t---;-+T---f'"'-- -l, ..... ,

' ', -+-~-+-~-.l-- ---x ' ',


v:_o_:-:lla=-----~'cl-~=---t--------'--'-'..::.-:::.
' ' [ .... - ---e. . .
• ,. (x)

Densidad de receptores N.lxl


1 "-+--------- ...
¡---se +se-¡
tipo-p ' un¡ón tipo-n
x=-x 0 _ x=O

Figura 12.5. Diagrama que ilustra los detalles de los potenciales en las bandas de energía y los
niveles casi Fermi de una unión p-n en presencia de un voltaje aplicado.
Potenciales y campos en las cercanías de una unión p-n 427

que respecta a sus concentraciones de equilibrio. La razón se puede entender al


estudiar la figura 12.5, en donde se muestra una unión con polarización inversa. La
barrera alta de potencial evita que los electrones del lado n y los huecos del lado p
se "derramen sobre" la unión hacia el lado opuesto; por otro lado, la presencia de
la barrera favorece a los portadores minoritarios (huecos en el lado n y electrones en
el lado p) para que se deslicen bajando por la pendiente de potencial hacia el lado
opuesto de la unión, en donde se convierten en portadores mayoritarios. Esto re-
duce notablemente la concentración de portadores minoritarios cerca de la unión.
Cuando se aplica una polarización directa, la altura de la barrera se reduce y los
electrones de la región n, y los huecos de la región p se derraman sobre la unión
convirtiéndose en portadores minoritarios en el lado opuesto. Sin embargo, también
en este caso la concentración relativa de los portadores minoritarios se ve mucho
más afectada que la concentración de portadores mayoritarios. 2
El resultado es que, cerca de la región de la unión, mientras que las pobla-
ciones de electrones y huecos se caracterizan independientemente por distribuciones
de Fermi, existen dos diferentes "niveles efectivos de Fermi" o "niveles quasi Fermi",
uno para la población de electrones y otro para la de huecos. Estos niveles casi
de Fermi se representan como e¡n para los electrones y e¡p (para los huecos) en
la figura 12.5. Lejos de la unión, en la región n, la concentración de equilibrio
de los huecos recibe poca influencia por el efecto de los huecos cercanos a la unión
y que se deslizan por la "pendiente" de potencial hasta la región p y, por tanto,
los niveles efectivos de Fermi para electrones y huecos son casi iguales. Sin em-
bargo, conforme se acerca a la unión, la concentración local de los huecos desciende
por debajo del valor de equilibrio como resultado de este efecto, en tanto que la
concentración de electrones raramente se ve afectada. Entonces, como se indica
en la figura 12.5 el nivel efectivo de Fermi de los electrones permanece igual en
tanto que el nivel efectivo de Fermi para los huecos se eleva a partir de equili-
brio, correspondiente a una concentración más pequeña de huecos en la región n
cerca de la ur.ión. Se produce un efecto similar invirtiendo los papeles de los niveles
casi de Fermi de electrones y huecos en la región p, al otro lado de la unión. El
comportamiento de los niveles casi de Fermi de huecos y electrones debe ser algo
semejante a lo que se indica en la figura.
En conexión con los cálculos acostumbrados casi siempre se supone que el
nivel casi Fermi de los portadores minoritarios ha llegado al valor de equilibrio
asociado con la misma especie de portadores que son los mayoritarios en la región
volumétrica al otro lado de la unión. Entonces, en la figura 12.5, el valor de e¡p en
A casi siempre se supone igual al valor de equilibrio en el extremo izquierdo, y el
valor de e¡n en B se supone idéntico al de la extrema derecha. Esto significa
sencillamente que los portadores de la misma especie en las orillas opuestas de la
región de carga espacial de la unión poseen la misma distribución de energía, en
virtud de la eficiencia de los procesos de colisión que se producen en dicha región.
Esta suposición lleva a una condición de frontera en las concentraciones de porta-
dores de la unión que serán de gran utilidad en el siguiente capítulo. Puesto que,
por ejemplo, para los electrones, la distancia entre la banda de conducción y el nivel
efectivo de Fermi para electrones en el lado n es en e(cp 0 - V0 ), menor que la
distancia correspondiente en el lado p como se ilustra en la figura 12.5, entonces, la

2 El requisito de neutralidad eléctrica en el material lejos de la unión, origina también una


alteración en la densidad de los portadores mayoritarios. Sin embargo, puesto que la densidad de
portadores mayoritarios en equilibrio es mucho mayor que la densidad de portadores minoritarios
en equilibrio, la adición de un número dado de electrones y huecos puede dar como resultado
un incremento en la densidad de portadores minoritarios de muchos órdenes, al tiempo que
aumenta la densidad de portadores mayoritarios en sólo un pequeño porcentaje.
428 Teoría de las uniones p-n de los semiconductores

razón entre la concentración de electrones en el borde de la región de carga espacial


en el lado n, y la que prevalece en el borde de la región de carga espacial en el
lado p, debe estar dada por

- _n.:.:."(.:. _X_:o.:. _+_:_)_ _ e(</>o- Vo)/kT (12.3-1)


np( -x 0 _) -e '

en donde las coordenadas x 0 + y - x 0 _ se refieren a la ubicación de los bordes de


la región de carga espacial en los lados n y p de la unión, respectivamente. Siguien-
do un razonamiento similar, las concentraciones de huecos a ambos lados debe estar
relacionada por

Pi -Xo_) = e•<<l>o-Vo)/kT
(12.3-2)
P.(xo +)

Al escribir estas ecuaciones, se supone que la aproximación de Boltzmann es


válida.
El potencial y el campo eléctrico en las regiones de carga espacial se puede
encontrar a partir de la ecuación de Poisson. En el caso en donde la densidad de
carga varía sólo en la dirección x, la ecuación de Poisson se puede escribir como

d 2 </J 4np(x) 4ne


- = - - - = - - (p- 11 + Nlx)- N.(x)). (12.3-3)
dx 2 K K

Para mayor facilidad, se escogerá el origen que se indica en la figura 12.5 tal
que en ese punto el potencial sea cero. 3 Además, la función de potencial ¡j>(x), que
contiene una constante arbitraria adicional, se definirá en relación con los bordes de
la banda de conducción y valencia de tal modo que tenga la posición del nivel
intrínseco de Fermi con respecro a ellos. En estas circunstancias se puede escribir

(1 2.3-4)

(12.3-5}

De igual manera, ec(x) y ev(x) se relacionan con if>(x) por medio de

(1 2.3-6)

(12.3-7)

Al substituir estos valores en la ecuación de Poisson (1 2.3-3), se obtiene


2 </J
d_ 4ne
= _ _ (U e-<•t.-<v;+e<t><xl)!kT _U e-<-e<t>(x)+<,,-,1.,¡¡kr
dx2 K v e

+ Nix)- N.(x)). ( 12.3-8)

3 Por ahora se supone que las densidades de donadores y receptores son funciones de la
distancia aunque la figura 12.5 se ha dibujado, para mayor simplicidad, como si fueran constan-
tes.
Modelo matemático simplificado de la unión p-n abrupta 429

En casi todas las circunstancias, la solución de esta ecuación constituye un


problema complejo y difícil. Este estudio se limitará a examinar varios casos particu-
lares que pueden comprenderse en términos relativamente sencillos. Por ejemplo, sea
un sistema en el que el voltaje aplicado es cero. En este caso, e¡n = e¡p = e¡, y
(haciendo referencia a la figura 12.5) es evidente que,

(12.3-9)

de donde, (12.3-8) se puede expresar como

d 2</J = 4nen¡ (ee<P<-<l!H _ e-etP<x)fkT _ Nd(x) + Na{x))


dx 2 " 11¡ n¡

4nen¡ ( e</J(x) Nk'C)- Na("<))


= - - 2senh - - - . ( 12.3-10)
" /..T 11¡

Esta es la ecuación diferencial fundamental que debe resolverse para obtener el


potencial tj>(x ). Para una unión abrupta se tiene que
N.(x) = N.= const}
(x <0) (12.3-11)
Nd(x) =O
y
N.(x) =O }
(x >O) (12.3-12)
Nix) = Nd = const
en cuyo caso, (12.3-1 O) da dos ecuaciones, una para el potencial cp_ (x) en la región
(x < 0), de la forma

d 2 </J _ . h erp- N •)
- =4nen¡
-dx2 -K - ( 2 Sll1 --+-
kT n¡
(x < O) (12.3-13)

y otra para el potencial tP+(x) en la región (x > 0), que se puede escribir como sigue

dz</J + = 4nen¡ (2 senh e</J + - N d) . (x > O) (12.3-14)


dx 2 K kT n¡

Estas ecuaciones se deben resolver para tP+(x) y tf>_(x) utilizando condiciones


de frontera apropiadas, que se verán en la siguiente sección. Desafortunadamente,
estas ecuaciones tampoco se pueden resolver con precisión por medios analíticos, de
manera que se deben introducir métodos numéricos o métodos físicos aproximados.
A continuación se analizará un modelo simplificado que se basa en las ecuaciones
precedentes y que admite una solución matemática exacta incluso cuando se tiene
un voltaje externo y que representa muy aproximadamente a la unión p-n abrupta
en casi todas las circunstancias de importada práctica.

12.4 MODELO MATEMATICO SIMPLIFICADO


DE LA UNION p-n ABRUPTA

En ciertas condiciones, se puede obtener una solución aproximada para una


unión p-n abrupta. Obsérvese que de acuerdo con (12.3-4) y (12.3-6), la concentra-
430 Teoría de las uniones p-n de los semiconductores

p(x)

eNd 1------r:-,...,
\

\
~------~-~x~o~------1--------~~'------~--.x
''\ Xo+
1

1
1

\ 1
' -eN0 1
1
j---sc -1----+sc -.j
tipo-p Unión tipo-n
Densidad de receptores N.= const. Densidad de donadores Nd =const.

Figura 12.6. Densidad real de carga (curva punteada) y la densidad de carga supuesta en el
modelo aproximado de la sección 12.4 (curva continua) correspondientes a una
unión abrupta p-n para la que <Po ~kT/e.

cton de portadores varía exponencialmente en función de rp, de modo que la densi-


dad de portadores disminuirá a un valor despreciable en comparación con el nivel
volumétrico existente lejos de la unión, conforme la energía potencial del borde de
la banda -erp varía por unos cuantos múltiplos de kT. Si la caída total de potencial
en la unión, rp 0 - V0 , es mucho mayor que kT, habrá una variación de la energía
potencial de varias veces kT que se logrará en una distancia relativamente pequeña
en comparación con la extensión lineal total de la región de carga espacial de la
unión. En estas circunstancias, la densidad de carga llega rápidamente a un valor
constante -eNa conforme se penetra a la región de carga espacial desde la región p.
y un valor constante eNd conforme se penetra a la región de carga espacial desde el
lado n, como lo indican las curvas punteadas de la figura 12.6.
En esta situación, un método bastante aproximado consiste en representar la
densidad de carga espacial mediante un valor positivo constante eNd, tratándose de
la parte del lado n que se encuentra entre la unión y el borde de la capa espacial
en este lado -y no más allá-, y representarla mediante un valor negativo constante
-eNa en el lado p de la unión hasta el borde de la región de carga espacial, y no
más allá de este punto. De acuerdo con esta aproximación, la densidad de carga se
representa mediante la línea continua de la figura 12.6. Por fortuna, la mayoría de
las uniones abruptas p-n que tienen un interés práctico satisfacen la condición
e(cfJo - Vo)~ kT en la que esta representación aproximada de la situación real es
aceptable.
Si el potencial electrostático se denota por rp+(x) para x >O, y por rp_(x) para
el potencial en la región x <O, y si se asignan los valores x 0 + y -x 0 _ a las
coordenadas de los bordes de las regiones de carga espacial en los lados n y p
respectivamente, la ecuación de Poisson toma la forma

(O<x<xo+), (12.4-1)

(-x 0 _<x<0) (12.4-2)


Modelo matemático simplificado de la unión p-n abrupta 431

(x > x 0 + ; x < -x 0 _). (12.4-3)

Si se supone que todo el voltaje aplicado a la muestra aparece como una caída
potencial en la región de la unión, entonces, en las regiones que quedan más allá de
las fronteras de las capas de carga espacial el potencial debe ser constante, por lo
cual,

cp+(x) = <f>+(x 0 +) = const (12.4-4)


<f>_(x) = <f>_( -x 0 _) = const (12.4-5)

Evidentemeate, estas soluciones satisfacen (12.4-3). Puesto que la caída total


de potencial en la región de la unión es rp 0 - V 0 , se debe tener también que

(12.4-6)

Además, se puede demostrar fácilmente, de acuerdo con el teorema de flujo


eléctrico de Gauss, que el campo eléctrico debe ser continuo en todas partes excepto
en una superficie que tiene una verdadera distribución de carga superficial. Se reco-
mienda al lector que efectúe la comprobación de este postulado como ejercicio. Esto
significa que en la unión,

-E+(O) = ( -d<f>+) = (d<f>_)


- = -E_(O) = -E0 (12.4-7)
dx 0 dx 0

en donde E+(x) y E_(x) representan los campos en las regiones (x >O) y (x <O) y
E 0 es el valor común en el origen.
Las ecuaciones (1 2.4- 1) y (1 2.4-2) se pueden integrar para obtener

(O<x<x 0 +) (12.4-8)

y
d<f>_ 4neNa
- = - - x + B = -E_(x) (-x 0 _<x<O) (12.4-9)
dx K

en donde A y B son constantes arbitrarias. De acuerdo con (12.4-4) y (12.4-5), más


allá de los límites Xo+ y x 0 _ de la región de carga espacial, el campo es cero y,
puesto que el campo debe ser continuo en todas partes, (1 2.4-8) debe dar drp+fdx = O
en Xo+ y (12.4-9) debe dar drp_jdx =O en x = -x 0 _, por lo cual,

4neNd 4neNa
A = - - x0 + y B=--Xo- (12.4-10)
K K

Y (1 2.4-8) y (1 2.4-9) se convierten en

d<f>_ 4neNa
- - = - - (x 0 +- x) = -E+(x) (0<x<x 0 +) (12.4-1 J)
dx K
432 Teoría de las uniones p-n de los semiconductores

y
d4J_ 4rreNa
- = - - (.x + x 0 _) = -E_(x) (-x 0 _<x<0) (12.4-12)
dx K

mientxas que, por supuesto,


(x > x 0 +; x < -x 0 _). (12.4-13)

Si en (12.4-11) y (12.4-12), x se iguala a cero, entonces, haciendo referencia a


(12.4-7), es evidente que

4neN.x 0 _
(12.4-14)
K

y, por tanto, que


(12.4-15)

De acuerdo (12.4-15), la razón de las anchuras de las dos capas de carga


espacial es la inversa de la razón de las densidades de impureza respectivas. Esto
implica que el número total de cargas positivas y negativas en cada capa es la
misma.
Al integrar una vez más (12.4-11) y (12.4-12), el potencial se obtiene como

(O<x<xo+) (12.4-16)

2neN.
4J_(x) = - - (x + x 02 _) +D. (-x 0 _<x<O) (12.4-17)
K

El punto cero del potencial se puede escoger arbitrariamente; para mayor faci-
lidad se seleccionará de tal modo que cf>+(O) = cf>_(O) =O. Si se substituye esto una
vez en (12.4-16) y (12.4-17), se pueden evaluar tanto C, como D. Combinando estos
resultados con (12.4-4) y (12.4-5) se ve claramente que el potencial debe tener la
forma

(0 <X< Xo+)
( 12.4-18)

2neN.
4J_(x) = - - [(x + x 0 _) 2 - x~_J (-x 0 _<x<O)
K

(12.4-19)
_.. (- Xo- ) = _ 2rreN.x~-
= 'l'- . (x < -x 0 _)
K
Modelo 111/ltemiÍtico simplificaclo de 14 unión p-n abrupta 433

Ahora, las expresiones para el campo y el potencial han quedado completas,


excepto que las distancias Xo+ y x 0 _ no se han especificado todavía. Para obtener
los valores de estas cantidades, los valores de cf>+(x 0 +) y cf>_(-x 0 _) dados por
(12.4-18) y (12.4-19) se pueden substituir en la condición de frontera (12.4-6), de
donde,

(12.4-20)

En esta ecuación, x 0 _ puede expresarse en función de x 0 + mediante (12.4-15),


y la expresión resultante se puede resolver para x 0 +, lo cual da

K((j> 0 - Vo) Na
Xo+ = (12.4-21)
2ne Ni N d + N a)

De acuerdo con (12.4-15), x 0 _ se puede obtener en la forma

(12.4-22)

Entonces, la anchura total combinada de las regiones de carga espacial es

Xo = Xo+ + Xo- = J K( 4>o - V0) ( 1


2ne Nd + Na
1) (12.4-23)

y el campo E 0 en la unión, de acuerdo con (12.4-14), se puede expresar como sigue

Eo = J8ne(4>o - V0 ) (..!.. + ..!..) 1


= 2(4> 0 - V0 ) (12.4-24)
K Nd Na Xo

Se debe hacer notar que x 0 +, x 0 _ y E 0 , están relacionadas con las densidades


de impurificación Nd y Na de un modo directo, como se demostró antes, y también
a través de cf>o, que es una función de Nd y Na tal y como lo expresa (12.2-5),
aunque la variación logarítmica de cf>o en función de Nd y Na es mucho más lenta
que la variación directa.
En la figura 12.7 se presentan las gráficas de la densidad de carga espacial, el
campo eléctrico y las variaciones del potencial electrostático tal y como los presenta
la teoría anterior, para una polarización cero, una polarización directa (V0 >O) y
una polarización inversa (V0 < 0).
De acuerdo con esta figura o con las ecuaciones anteriores, es obvio que
(a) La capa de carga espacial tiene mayor extensión en regiones tipo p o n
levemente impurificadas, que en regiones con impurificación mayor. Para
una unión dada, la capa de carga espacial se extiende más dentro de la
región en la que la impurificación es menos fuerte.
(b) El valor máximo de campo E 0 es muy alto en las uniones en donde las
regiones p y n están fuertemente impurificadas, y mucho más pequeño en
las uniones en donde una o ambas regiones están levemente impurificadas.
(e) En condiciones de polarización inversa, las regiones de carga esp1cial se
extienden hacia afuera dentro del cristal; la extensión cf;- las !..egion~~..!!,e _
434 Teoría de las uniones p-n de los semiconductores

P(x) E(x)
V¡¡=O

eNd 1----rL,------, t
V.> O _j V.o< O -!11
o l 1

1 ! -x
\ /
/ -x
1 ! \
\ /
/

1 !
L--- -L-t-~-==l- - eNo
\
\Ea
\
/
/
/

\ Ea V¡¡<O /
1 \ \.-/

(a) ( b)
' \ /
/
/

Eo
4> ( x)
V¡¡< O
------ ...... ...
''
''
--"------
-v;>_o______\ ,
\

\
\~
\
\
. -------
\
\
\
\
\
\
\

(e) ''
' ... ... ...

Figura 12.7. Representación esquemática de (a) densidad de carga, (b) el campo eléctrico y (e)
el potencial en las cercanías de una unión abrupta p-n en presencia de varios
voltajes aplicados, según se calcularon de acuerdo con los métodos de la sección
12.4.

carga espacial puede hacerse muy grande en uniones en donde la región n


o la p esté ligeramente impurificada. Para - V 0 ~ 1/Jo (una gran polarización
inversa), la extensión de las regiones de carga espacial es proporcional a
(-V0 ) 1 12 , de acuerdo con (12.4-21) y (12.4-22).
(d) En condiciones de polarización inversa, el campo máximo E 0 se hace muy
grande; a una gran polarización inversa, es proporcional a (- V0 ) 1 12 •
Estas conclusiones, aunque se han verificado para un modelo específico de
unión abrupta, son bastante gen~rales y aceptables para todas las uniones p-n de
semiconductores, ya sean abruptas o graduales (aunque para uniones graduales, la
dependencia de raíz cuadrada que se menciona en (e) y (d) ya no es cuantitativa-
mente correcta).
Las relaciones derivadas en las páginas anteriores son bastante exactas para las
condiciones de polarización inversa; pero no debe esperarse que se apliquen perfecta-
mente a polarizaciones directas elevadas. En este último caso, se tiene grandes flujos
de corrientes y existen caídas de voltaje apreciables en las regiones volumétricas
fuera de las capas de carga espacial de la unión, que hacen que la caída de voltaje
Capacitancia de unión; determinación del potencial interno 435

4> (x)

Figura 12.8. Representación aproximada del potencial cerca de una unión abrupta p-n en
condiciones de intensa polarización directa.

de dicha umon sea diferente del voltaje externamente aplicado. Entonces, el poten-
cial adquiere una forma semejante a la que se ilustra en la figura 12.8. En la
tabla 12.1 se dan algunos valores numéricos para las propiedades de las capas de
carga espacial asociados con uniones p-n típicas del germanio.

12.5 CAPACITANCIA DE UNION; DETERMINACION


DEL POTENCIAL INTERNO

Los resultados de la sección anterior sugieren claramente que una unión p-n se
comporta en muchas formas de un modo semejante a un capacitar de placas parale-
las. Se tienen dos capas de carga espacial que contienen cantidades iguales y opues-
tas de carga, y la cantidad de carga perteneciente a las capas aumenta conforme se
incrementa el voltaje inverso. La carga asociada con un área unitaria de la región de
carga espacial positiva en el lado n de la unión, es claramente el producto de la
densidad de carga eNd y el volumen x 0 + de la región de carga espacial correspon-
diente a una unidad de área de la unión. La carga por unidad de área de capa de
carga espacial negativa en el lado p, se puede calcular en la misma forma. En ambos
casos, se ve claramente con la ayuda de (12.4-21) o (12.4-22), que la carga por
unidad de área de unión es

(12.5-1)

Un pequeño incremento del voltaje aplicado LlV0 se verá acompañado por un


cambio LlQ en la carga almacenada. Si la capacitancia diferencial por unidad de área
asociada con la unión a este valor de voltaje aplicado se define como klQ/dV0 1,
entonces, de acuerdo con la ecuación anterior, es obvio que

(12.5-2)
436 Teoría de las uniones p-n de los semiconductores
De acuerdo con esto, se puede llegar a la conclusión de que las uniones en las
que tanto la región p como, la región n están fuertemente impurificadas, tendrán
una capacitancia muy alta, en tanto que si la región n o la p o bien, ambas, están
levemente impurificadas, la capacitancia será mucho menor. Para voltajes de polariza-
ción inversa que sobrepasan notablemente el potencial de contacto interno <Po, se
encontrará, de acuerdo con (12.5-2), que e varía casi proporcionalmente a
(- V0 ) 1 12 • En efecto, esta variación de capacitancia es característica de las uniones
abruptas que se encuentran en dispositivos fabricados por medio de procesos de
aleación. Las uniones graduales o no abruptas tales como las que se encuentran en
muchos dispositivos elaborados mediante la difusión de impurezas tipo n en un
cristal tipo p, o viceversa, presentan una capacitancia que varía con el voltaje inverso de
un modo más lento que aquélla. Por ejemplo la capacitancia de una unión lineal-
mente gradual con polarización inversa, varía con el voltaje como (- V 0 )- 1 13 •
Para rectificadores de unión abrupta, las mediciones de capacitancia proporcionan
una forma sencilla para determinar el potencial de contacto interno <Po. Con este fin.
la ecuación (12.5-2) se puede reordenar en la siguiente forma

(12.5-3)

La capacitancia ppr unidad de área e se puede medir experimentalmente y se


hace una gráfica de tje2 en función del voltaje inverso -V0 , como se ilustra en la
figura 12.9. De acuerdo con (12.5-3), esta gráfica debe ser una recta. La intersección
de esta gráfica en el eje V0 extrapolado de los datos medidos, proporciona el valor
de <Po tal y como se indica. De acuerdo con la pendiente de esta línea determinada
de un modo experimental, se puede evaluar la cantidad _VdNaf(Nd +Na); si un lado
de la unión tiene una impurificación mucho más fuerte que el otro,4 esta cantidad
es aproximadamente igual a la concentración de impurezas en el lado cuya impurifi-
cación es más leve. La concentración de impurezas en el lado más fuertemente
impurificado se puede obtener una vez que se conocen <Po y la otra concentración

Figura 12.9. Una gráfica de 1/C 2 en función del voltaje de polarización, que ilustra la determina-
ción del potencial de contacto interno y las concentraciones de impurezas receptoras
y donadoras a partir de las mediciones de capacitancia.

4 Este es casi siempre el caso en uniones producidas mediante procesos de aleación, como
se verá más adelante.
TABLA 12.1.
Propiedades de uniones abruptas p-n en el
germanio (K = 16)

N. N. e/> o Vo Xo+ Xo- Xo Eo e


(cm-') (cm- 3 ) (V) (V) (¡.L) (¡.L) (¡.L) (kv/cm) (f.Lffcm 2 )

10'4 10 14 0.0702 o 0.788 0.788 1.58 0.891 0.00898


-1 3.08 3.08 6.15 3.48 0.00229
-5 6.69 6.69 13.4 7.57 0.00105
-50 21.0 21.0 42.1 23.8 0.000336
-500 66.5 66.5 133.0 75.2 0.000106

10'5 10'5 0.1854 o 0.405 0.405 0.810 4.58 0.0175


10'6 10'6 0.3005 o 0.163 0.163 0.326 21.5 0.0434
1017 10 17 0.4156 o 0.0606 0.0606 0.121 68.6 0.117
10' 8 10 18 0.5308 o 0.0217 0.0217 0.0433 245.2 0.327
10' 9 10'9 0.6459 o 0.0076 0.0076 0.0151 855.5 0.Y37

10'4 10'8 0.3005 o 2.31 0.00023 2.31 2.61 0.00613


-1 4.80 0.00048 4.80 5.42 0.00295
-5 9.68 0.00097 9.68 10.95 0.00146
-50 29.8 0.00298 29.8 33.7 0.000475
-500 94.1 0.00941 94.1 106.4 0.000151
438 Teoría de las uniones p-n de los semiconductores

de impureza a partir de (12.2-5). Se puede emplear un procedimiento similar para


determinar Na y Na, incluso si las densidades de impurezas en ambos lados de la
unión son comparables, aunque los aspectos matemáticos son un poco más comple-
jos. Los detalles de este procedimiento se asignan como ejercicio para el lector. En
la tabla 12.1 se muestran algunos datos numéricos de la capacitancia de estructuras de
unión típicas.

EJERCICIOS
l. Demuestre que existe una discontinuidad en el potencial electrostático de una magnitud
47T A en donde .::l es el momento dipolar por unidad de área, en los lados opuestos de una capa
dipolar eléctrica.
2. Se intenta medir el potencial de contacto interno de una unión p-n conectando un
voltímetro de alta impedancia con conductores de cobre, a contactos que se encuentran en los
lados opuestos del cristal que contiene una unión. El voltímetro indica una lectura de cero. Un
potenciómetro substituye al medidor, pero la lectura sigue siendo cero. Explique físicamente la
falla de estos dos métodos y analice los potenciales de contacto entre el cobre y las regiones
tipo n y tipo p.
3. Utilice el teorema del flujo eléctrico de Gauss para demostrar que el campo eléctrico
debe ser continuo en todas partes excepto en una superficie que tiene una distribución de carga.
4. Explique físicamente por qué el ancho de la región de carga espacial de una unión
abrupta p-n es proporcional a la raíz cuadrada más que a la primera potencia de la caída de
potencial de la unión 1/>o- V0 •
5. Encuentre expresiones aproximadas para los potenciales, los campos y el ancho de las
capas de carga espacial asociadas con una unión linealmente gradual en la que

Nd = O, N. = - cxx (x < 0)

N. = O, Nd = cxx (x >0)

donde a es una constante. Suponga que la caída total de potencial en la región de carga espacial
es 1/Jo- Vo y que 1/Jo- Vo ~kT. Nota: use una extensión de los métodos expuestos en la
sección 12.4.
6. Encuentre la capacitancia diferencial por unidad de área asociada con la unión lineal-
mente gradual del ejercicio 5.
7. Demuestre la forma en que el potencial de contacto interno y Na y Na se pueden
obtener a partir de una gráfica de datos experimentales como la que se muestra en la f¡gu-
ra 12.9. Derive fórmulas explícitas para Na y Na en función de la pendiente de la gráfica
experimental y el potencial interno 1/>o.

LECTURAS RECOMENDADAS
J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, Nueva York (1962), capítulo l.
Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs N. J.
(1962), capítulo 4.
W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., Inc., Nueva York
(1950).
R. A. Smith, Semiconduc10rs, Cambridge University Press, Londres (1961),
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., lnc., Nueva York (1958).
CAPITUW 13
Rectificadores de unión p-n

.y transiStores

13.1 TEORIA DEL RECTIFICADOR DE UNION p-n

En el capítulo anterior se examinó la naturaleza física de una unión semicon-


ductora p-n. También se analizaron cuantitativamente ciertas manifestaciones físicas
de la estructura de la unión, tales como la carga espacial, los campos eléctricos, los
potenciales y la capacitancia, basándose en un simple modelo de unión abrupta. En
esta sección se verá el flujo de corriente asociado con la unión en condiciones de
desequilibrio y la característica de corriente-voltaje de un simple rectificador de
unión p-n.
El modelo de unión que se adoptará se ilustra en estado de equilibrio en la
figura 13 .1. Se supone que las regiones tipo p y n son homogéneas y se P.xtienden
al infinito en las direcciones + x y - x. En el estado de equilibrio habrá cierto
número de electrones presentes como portadores mayoritarios en el lado n, que
tienen la suficiente energía para saltar la barrera de potencial y difundirse en el lado
p de la unión. En la región p, estos electrones constituyen portadores minoritarios y

f-ec#>

-- - - -
-- -- - = ~e

.,
+ + + +
+ ++
+ + Vo= O --x
+
+ +
Carga espacial + + +
••
+
+ +
Jp,- -Jp,
tipo-p ti po-n

Figura 13.1. Diagrama de potencial de una unión p-n en condición de equilibrio, en donde
se muestran las distribuciones de portadores de carga y los flujos de generación y
recom binación.
440 Rectificadores de unión p-n y transistores

pueden, después de cierto tiempo, desaparecer mediante su recombinación con hue-


cos. Por tanto, en equilibrio se tiene una corriente de electrones de la región n,
pasando sobre la unión, hasta la región p, en donde se pierden por recombinación.
Este flujo electrónico de equilibrio se citará como flujo de recombinación lnr· Sin
embargo, se obvio que en la condición de equilibrio no puede haber un flujo neto
de corriente; es más, de acuerdo con el principio del balance detallado, en estado de
equilibrio, cualquier proceso microscópico de transporte y su inversa deben proceder
a la misma velocidad. La inversa de este proceso en particular es la generación de
pares electrón- hueco en el lado p de la unión, y la difusión subsecuente de electro-
nes a través de la unión hacia el lado n, en donde se convierten en portadores
mayoritarios. Este proceso inverso conduce a una corriente electrónica que fluye de
la región p a la región n y que se denominará corriente de generación. En estado de
equilibrio, el flujo de partículas resultante Jng debe ser exactamente igual a -Jnr·
Estas mismas observaciones se aplican a los huecos por igual; existe un flujo de
recombianción Jpr que se origina cuando los huecos de la región p se desplazan
sobre la barrera hasta la región n, en donde se recombinan con electrones. Esto va
acompañado por un flujo de generación Jpg que se crea mediante la generación
térmica de pares en la región n, seguida de la difusión de huecos térmicamente
generados a través de la unión. En estado de equilibrio se debe tener J ng = - J nr·
Por tanto, en estado de equilibrio los flujos totales de huecos y electrones a través
de la unión son igual a cero.
La base para la acción de una unión p-n como rectificador es como sigue.
En condiciones de polarización inversa, la altura de la barrera de potencial en la
unión aumenta en una cantidad igual a -e V 0 , en donde V 0 es el voltaje aplicado.
En estas condiciones, es difícil para los portadores vencer la barrera por difusión y,
por ende, J nr y J pr se hacen muy pequeños; sin embargo, los flujos J ng y J pg
dependen sólo de la velocidad de generación térmica de pares electrón-hueco en las
regiones volumétricas respectivas y, en consecuencia, no se ven reducidos. Por tanto,
conforme se incrementa el voltaje de polarización, la densidad de corriente a través

-eq,

-eq,

V0 <O _ tipo-n

+++++++
++++++
+ + + +
+ + +
-x
+

+ + +
tipo-p +
+
~-----.,.+ <V Jp,---· -Jpg
-Jpg
Unión tipo-p Unión tipo-n
(a) ( b)

Figura 13.2. Diagrama de potencial de una unión p-n (a) con polarización inversa, (b) con
polarización directa, en donde se señala cómo se modifican los flujos de genera-
ción y recombinación.
Teoría del rectificador de unión p-n 441

de la unión tiende a un valor pequefio constante -e(Jpg- lng), denominado co"ien-


te de saturación, que está limitada por el número de pares térmicamente generados
que se crean en las regiones volumétricas cerca de la unión. Esta corriente depende
sólo de parámetros del material y la temperatura, y no puede aumentar notable-
mente, no importa el alto valor que puede adquirir el voltaje. Esta situación física se
ilustJ;a esquemáticamente en la figura 13.2(a). Cuando se aplica un voltaje de polari-
zación directo, la altura de la barrera de potencial se reduce y es muy fácil para los
electrones mayoritarios del lado n y los huecos mayoritarios del lado p, difundirse
sobre la barrera hacia los lados opuestos respectivos en donde pueden convertirse en
portadores minoritarios y, finalmente, recombinarse. En este caso, las corrientes de
recombinación Jpr y lnr pueden hacerse muy grandes en comparación con sus valo-
res de equilibrio. No obstante, las corrientes de generación lng y Jpg permanecen
iguales, ya que están limitadas por la velocidad de generación térmica. El resultado
es un gran flujo de corriente, como se ilustra en la figura 13 .2(b ). La estructura de
la unión presenta una impedancia muy elevada en la dirección de polarización inver-
sa y una impedancia muy pequefia en la dirección de polarización directa, por lo
que se comporta como un rectificador. En la figura 13.3 se muestra la relación
corriente-voltaje. En la condición de polarización inversa se originan flujos de co-
rriente de saturación consistentes en portadores minoritarios generados de un modo
térmico en las regiones volumétricas que quedan fuera, pero son adyacentes, a las
capas de carga espacial de la unión y que la barrera de potencial de la unión se
encarga de recoger. En la condición de polarización directa, la corriente se compone
en su mayor parte de portadores mayoritarios que se difunden sobre la barrera
reducida para convertirse en portadores minoritarios en la región de conductividad
opuesta, al otro lado de la unión; en efecto, la unión inyecta un gran número de
portadores minoritarios hacia las regiones volumétricas adjuntas a ambos lados.
Puesto que el número de electrones que poseen la energía suficiente para
sobrepasar la barrera de potencial de la unión es proporcional a e-e(v>o- Vo)fkT =
(const)eeVofkT (suponiendo que la estadística de Maxwell-Boltzmann es válida), es
de esperarse que Jnr y Jpr sean proporcionales a eeVofkT. Sin embargo, para V0 =O,
Jpr =Jpg Y Jnr =1n 1p de donde, se tiene que

J pr = J pge•VofkT (13.1-1)
y

J nr = J ng e•VofkT • (13.1-2)

Figura 13.3. Relación corriente-voltaje de una unión p-n, con la región de ruptura inversa.
442 Rectificadores de unión p-n y transistores

Entonces, de acuerdo con la figura 13.2,

(13.1-3}

(13.1-4¡

La relación entre el voltaje aplicado y la densidad de corriente eléctrica 1


estará dada por
(13.1-5)

en donde la densidad de corriente de saturación 10 es la suma de las densidades de


corriente de generación

(13.1-6}

La relación que existe entre la corriente y el voltaje que aparece en la figu-


ra 13.3 es una gráfica de la ecuación (13.1-5) antes mencionada. A continuación se
procederá a sacar el resultado (13.1-5) por medio de un método de cálculo más
riguroso que cuenta con dos ventajas: la primera, que proporciona una expresión
más explícita de la corriente de saturación y, segunda, que forma la base para la
técnica de cálculo que se puede aplicar a dispositivos de unión más complicados.
El procedimiento que se seguirá consiste en resolver la ecuación de continuidad
para los portadores en exceso, tanto en la región n, como en la p, y aplicar las
condiciones apropiadas de frontera a la unión y a todas las demás partes del sistema.
Con este fin se supondrá que la unión es planar y que el plano de unión se
extiende esencialmente al infinito en las direcciones y y z, de tal manera que sólo se
requiere tomar en cuenta las variaciones de concentración de portadores y el flujo de
corriente a lo largo de la dirección x. También se supondrá que se ha llegado a un
estado estacionario y que todo el voltaje aplicado al sistema aparece en la región de
carga espacial asociada con la unión. Las caídas de voltaje y los campos eléctricos en
el material que se encuentra fuera de la región de la unión son, por tanto, desprecia-
bles y el transporte en dichas regiones es puramente difusivo. En estas condiciones.
las ecuaciones de continuidad para los electrones de la región p y los huecos de la
región n, tienen la forma

(región-p, x < -x 0 _) (13.1-7)

(región-n, x > x 0 +) (13.1-8)

en donde,

y (13.1-9)

Como de costumbre, sólo se tratan explícitamente las ecuaciones de continui-


dad para portadores minoritarios en cada región; pero se debe recordar que existe un
exceso de concentración de electrones en todas partes, dentro de la región n, que es
igual a la concentración local de huecos en exceso, y una concentración de huecos
Teoría del rectificador de unión p-n 443

en exceso en toda la región p, que es igual a la concentración local de electrones en


exceso, con el fin de que se satisfaga el requisito de neutralidad eléctrica. La fuente
última de estos portadores mayoritarios excedentes la constituyen los contactos
extremos del dispositivo (que están alejados de la unión en el modelo más o menos
idealizado que está considerando). En cierto modo, la inyección de una distribu-
ción de portadores minoritarios da como resultado la formación inmediata de una
distribución adjunta de portadores mayoritarios que vacía el resto del dispositivo de
este tipo de portadores, creando instantáneamente un campo que atrae a los porta-
dores mayoritarios neutralizantes hacia adentro, desde el contacto extremo. En la
condición de estado estacionario se mantiene una neutralidad aproximada en todas
partes excepto dentro de la región de carga espacial de la unión.
Las condiciones de frontera que van a usarse indican lejos de la unión que la
densidad de portadores minoritarios excedentes debe tender a cero, de donde,

para X= -oo , (13.1-10)

Pn- Pno =O para X= +oo (13.1-11)

en tanto que las condiciones de frontera (12.3-1) y (12.3-2) desarrolladas en el


capítulo anterior deben satisfacerse en la unión. El uso de estas condiciones de
frontera simplifica el análisis, si se supone que la densidad de portadores en exceso
es mucho más pequeña en todas partes que la densidad de portadores mayoritarios
en equilibrio. Es evidente que esta condición se satisfará siempre en el dispositivo a
todos los voltajes de polarización directa, excepto los muy grandes. Si se hace esta
suposición, ent;:mces, en (12.3-1) nn(Xo+) puede igualarse a nno• mientras que en
(12.3-2), Pp( -x0 _) puede considerarse 1 igual a Ppo. Entonces, estas condiciones de
frontera toman la forma

np{ -Xo-) = e-e(+o-Vo)/kT


(13.1-12)
nno
y
e -e(+o-Vo)/kT.
(13.1-13)

Las soluciones generales de las ecuaciones de continuidad (13.1-7) y (13.1-8) se


pueden expresar como

(región-p) (13.1-14)

(región-n) (13.1-15)

en donde A, B, C y D son constantes arbitrarias. Se puede ver claramente que, para


satisfacer las condiciones de frontera (13.1-10) y (13.1-11), es necesario determinar
que B = C =O. Así también, puesto que cuando el voltaje aplicado V0 es cero,

1 De otra manera, sería necesario escribir nn(Xo+)=nno+fpn(Xo+>-Pno] y Pp(Xo-)=


Ppo +[np(- xo_)- npo].
444 Rectificodores de unión p-n y transistores

np(-x 0 _)=npo y Pn(Xo+)=Pno• como lo indican (13.1-12) y {13.1-13), la canti-


dad e-e4>o/kT se puede expresar -en función de la relación de las concentraciones de
equilibrio de huecos y electrones en los lados opuestos de la unión2 , como sigue

e-e+ofkT = npo = Pno (13.1-16)


nno Ppo

Esto permite expresar las condiciones de frontera {13.1-12) y {13.1-13) en la


forma
n P(-x o- ) = n pO eeVofkT (13.1-17)

y
(13.1-18)

Si se hace que B = C= O, en {13.1-14) y {13.1-15), y se aplican {13.1-17) y


{13.1-18) para evaluar las otras dos constantes, se puede demostrar fácilmente que

np - npo = npo(eeYo!kT - 1)e(x+xo-l/Ln (región-p) (13.1-19)

Pn- Pno = Pno(eeVofkT- 1)e-(x-xo+l/Lp {región-n) (13.1-20)

Estas ecuaciones permiten ver que para una polarización inversa {V0 <O) la
concentración de electrones en la región p y la concentración de huecos en la región
n son menores que el valor de equilibrio; en este caso, la concentración de porta-
dores minoritarios en exceso es negativa. Se puede afirmar lo contrario cuando el
voltaje de polarización aplicado tiene un sentido directo (V0 > 0). Las ecuaciones
{13.1-19) y {13.1-20) se pueden emplear para encontrar las corrientes de huecos y
electrones que fluyen dentro de las regiones de carga espacial desde el lado n y el
lado p del cristal, respectivamente. Se supondrá que la corriente de electrones que
cruza la unión es la misma que la corriente de electrones minoritarios que fluye
dentro de la región de carga espacial, desde el lado p, y que la corriente de huecos
que cruza la unión es igual a la corriente de huecos minoritarios que fluye dentro
de la región de carga espacial, desde el lado n. Al hacer esto, se está desechando
cualquier generación o recombinación térmica de portadores que pueda ocurrir den-
tro de la capa de carga espacial propiamente dicha. 3 Esto se justifica por el hecho
de que el espesor de la capa de carga espacial es, en la mayoría de los casos, muy
pequeño y los campos muy altos dentro de la capa de carga espacial aceleran casi
siempre a los electrones desde el lado p, y a los huecos desde el lado n, para que
atraviesen la capa en un intervalo muy pequeño en comparación con sus tiempos de
vida. Al hacer esta simplificación, la corriente de unión se puede evaluar determi-
nando las corrientes de difusión de los portadores minoritarios en las fronteras de la
región de carga espacial, lo cual da

1 Esto se establece también fácilmente a partir de (12.2-3) ó (12.2-4).


3 Si no se efectuara esta aproximación, las ecuaciones de continuidad (incluyendo los
términos apropiados del campo} tendrían que resolverse en las dos capas de carga espacial e
igualarse con las soluciones de fuera, como las expresan (13.1-19) y (13.1-20) en x 0 + y - x 0 _
con condiciones de frontera adecuadas. En este caso, el cálculo será más díficil, aunque más
general.
Teoría del rectificador de unión p-n 445

JiO}~Jn(-Xo_)=
dndP)
-Dn ( - n 0 D"(eeVo/kT -1}
= _ __f!____L (13.1-21)
X -xo- n

y
J p(O),..,
=
(dp")
J p(x O+ ) = -D p d = PnoDp
L (eeVofkT _ l} . (13.1-22)
X XO+ p

La corriente eléctrica que cruza la unión es, entonces,

1 = e(Jp(O)- Jn(O)) = e(nP~~n + Pn~~P)(eeVo/kT- 1). (13.1-23)

Este resultado tiene la misma forma que el que se obtuvo anteriormente como
(13.1-5); ahora, la corriente de saturación es

(13.1-24)

Las concentraciones reales de huecos y electrones a ambos lados de la unión,


tanto para la polarización directa como para la inversa, se muestran en la figura 13.4
para un rectificador típico de unión p-n del tipo que se acaba de describir. De
acuerdo con la ecuación anterior, se encuentra que la corriente de saturación incluye
las densidades de equilibrio de portadores minoritarios npo y Pno los coeficientes de
difusión Dn y Dp, así como los tiempos de vida de los portadores en exceso a
través de las longitudes de difusión Ln y Lp. Esto se puede expresar en función de
las densidades de portadores mayoritarios aplicando la relación

(13.1-25)

en donde, (13.1-23) se puede expresar en la siguiente forma

(13.1-26)

Parece que la corriente de saturación se puede reducir mediante el uso de un


material con impurificación relativamente fuerte en la región n y p, y también
haciendo que el tiempo de vida de los portadores en exceso sea lo más grande
posible en ambas regiones. De acuerdo con (13.1-26}, la corriente de la saturación
depende de la temperatura a través d¡: Dn, Dp, Ln, Lp y n¡. De estos parámetros, el
más sensible a la temperatura es la densidad de portadores intrínsecos n¡ y, por
tanto, la corriente de saturación debe aumentar rápidamente al incrementarse la
temperatura. Los semiconductores que tienen bandas de energía prohibida relativa-
mente grandes (y, por ende, valores más o menos pequeños de n¡), son convenientes
para elaborar rectificadores de unión p-n que deban manejar densidades elevadas
de corriente y operar a altas temperaturas. En estas condiciones de operación, la
densidad de portadores intrínsecos dentro del semiconductor con esa banda pequeña
se hace excesiva y la corriente de saturación adquiere un gran valor, lo cual da
como resultado una eficiencia pobre de rectificación y una generación excesiva de
calor en la región de polarización inversa, como se muestra en la figura 13.5. En
consecuencia, los rectificadores de silicio son superiores a las unidades de germanio
para aplicaciones de alta corriente o alta temperatura. Desafortunadamente, la baja
446 Rectificadores de unión p-n y transistores

Concentración Concentración

Déficit Déficit de huecos


electrónico

Región
tipo-p
np(x) Región
.
tlpO-n -·
de la unión de la unión
(a) Polarización directa (b) Polarización inversa

Figura 13.4. Concentraciones de electrones y huecos en la cercanía de una unión p-n (a) con
polarización directa y (b) con polarización inversa.

corriente de saturación ele los semiconductores de bandas prohibidas grandes, a tem-


peraturas bajas, produce una impedancia más alta en el estado de polarización direc-
ta y, por ende, una gran caída de voltaje directo para una corriente dada. Esto
representa una mayor pérdida de potencia dentro del dispositivo y una generación de
calor interno superior en condiciones de corriente pequeña. Por esta razón muchas
veces se prefiere usar rectificadores de germanio cuando se tiene como requisito una
baja caída de voltaje en sentido directo a corrientes bajas, y cuando no es impor-
tante un buen funcionamiento en condiciones de alta corriente y alta temperatura.
Las fracciones ele la corriente total de unión portada por electrones y huecos
se menciona a veces como las eficiencias de inyección de electrones y huecos, res-
pectivamente. De acuerdo con (13.1-21) y (13.1-22), es obvio que estas cantidades
están dadas por

(13.1-27)

(13.1-28)

En una umon simétrica, en donde Pp 0 = nn 0 , las corrientes de electrones y


huecos son aproximadamente iguales, a condición de que la relación de movilidad b
sea del orden de la unidad y que Ln y Lp no difieran en gran manera. Sin embargo,
en un dispositivo asimétrico en el que una región está más fuertemente impurificada
que la otra, las expresiones anteriores demuestran que casi toda la corriente que
Corrientes y campos en los rectificadores de unión p-n 447

IVc, Potencia

Corriente
1saturación
alta de

Corriente
baja de
Región saturación
de ruptura

Figura 13.5. Disipación de potencia de un rectificador de unión p-n en función del voltaje
aplicado.

fluye por la umon es transportada por el portador que constituye el elemento


mayoritario dentro de la región fuertemente impurificada. Desde el punto de vista
físico esto es cierto, ya que los portadores mayoritarios de la región con impurifica-
ción leve que, por ejemplo. podrían inyectarse dentro de la otra región si se aplicara
una polarización directa, existen en una cantidad reducida en comparación con los
portadores mayoritarios dentro de la región de gran impurificación que, en condicio-
nes similares, podrían inyectarse hacia el lado de impurificación ligera. Más tarde se
verá que la eficiencia de inyección de la unión del emisor es un factor importante
en la ganancia de un transistor de unión.
Si el voltaje de polarización inversa aplicado a un rectificador de unión p-n se
incrementa uniformemente, se llegará a un punto en el que la corriente inversa
aumenta de un modo repentino y abrupto, como se ilustra en las figuras 13.3 y
13.5. Este fenómeno se conoce como ruptura y el voltaje al que se produce se
denomina voltaje de ruptura del dispositivo. Si éste funciona mucho más allá del
punto de ruptura, se generará internamente una gran cantidad de calor, ya que tanto
I como IVo 1son grandes y puede fundirse o quemarse en un lapso muy corto. En el
siguiente capítulo se presentará un breve estudio de los mecanismos típicos que
intervienen en la ruptura de los rectificadores de unión p-n.

13.2. CORRIENTES Y CAMPOS EN LOS RECTIFICADORES


DE UNION p-n

Para obtener los resultados de la sección anterior, se supuso que todo el


transporte de portadores de carga en las regiones volumétricas p y n adyacentes a la
región de carga espacial de la unión es puramente difusivo. La justificación física de
esta suposición es que casi todo el voltaje aplicado a un dispositivo de unión p-n
aparece en la región de carga espacial de la unión que está casi vacía de portadores
de carga y, en efecto, tiene una resistividad mucho mayor que las regiones situadas a
ambos lados.
No obstante, se verá que en realidad los resultados obtenidos, contradicen la
suposición; es necesario tratar de determinar si esta contradicción es lo suficiente-
448 Rectificadores de unión p-n y transistores

mente grave para que se abandone este planteamiento y vuelva a comenzarse desde
el principio. Como se verá, en la mayoría de los casos no sucede esto. Por ahora, la
atención se deberá enfocar en la región n del dispositivo (x > x 0 +)· Obviamente, en
esta sección del dispositivo, los flujos de partículas Jn y JP se pueden expresar
como

dn,.
Jn = -Dn -
dx - nnrn
"E (13.2-1)
y

(13.2-21

en donde E es el campo eléctrico que hasta ahora se ha despreciado. Del mismo


modo, puesto que no existen fuentes ni escapes para la corriente eléctrica dentro
de la región volumétrica, es necesario tener, en el estado estacionario, como ecuación
de continuidad para la densidad de corriente eléctrica 1,

op (13.2-3)
--=V·I=O
at
en donde p es la densidad de carga. En el sistema unidimensional que se está
viendo, esto significa que
dl/dx =O, ó l(x) = e(Jp(x)- Jix)) = const. (13.2-4)

Las expresiones de corriente de partículas (13.2-2) se pueden transformar en


una expresión algo más útil haciendo notar que, debido a la condición de neutrali-
dad eléctrica ~n = ~p. la densidad de portadores mayoritarios se puede escribir como
sigue
(13.2-5)

de donde,
dn,. dp,.
-=- (13.2-6)
dx dx

Cuando se substituyen estas relaciones en (13.2-1) y (13.2-2), se insertan las


ecuaciones resultantes en la expresión de continui~ad (13.24) y, resolviendo para el
campo E, se obtiene
dp,.
1- eDp(b- 1) -d-x
E=-~--~--~-~ (13.2-7)
eJJ.p[bn,.o + b(p,. - Pno) + p,.].

Los resultados obtenidos en la sección anterior en la forma de las ecuaciones


(13.1-20) y (13.1-23), suponiendo que el efecto de los campos eléctricos en la
región volumétrica n del dispositivo, que queda fuera de la región de carga espacial,
puede ser despreciable en comparación con el efecto del transporte difusivo, se
pueden substituir ahora en (13.2-7) para corroborar la consistencia de los resultados
Corrientes y campos en los rectificadores de unión JH1 449

con la supos1c1on. En el capítulo 10 se demostró que, en general, un campo eléc-


trico no altera el carácter difusivo del perfil de concentración, a menos que se
sobrepase el valor crítico dado por (10.244). Si &e observa que los coeficient&' de
transporte ambipolar apropiados son Dp y IJ.p, y si se usan (13.1-9) y (10.2-11), esta
condición se puede expresar como
kT
IEI~-. (13.2-8)
eLP

Si los valores de Pn e 1 dados por (13.1-20) y (13.1-23) se substituyen en


(13.2-7), esta ecuación toma la siguiente forma

lo+ epnoDp (b- 1)e-<x-xo+)/Lp


E_ LP . (eeYo/kT _ 1) (13.2-9)
- qo + Pnoep-p(b + 1)(eeYo/kT- 1)e (x xo+)/Lp

en donde a0 = ep.p(pn 0 + bnno) es la conductividad de equilibrio del material tipo n


y en donde 10 está dada por (13.1-24). Para V 0 =O, desaparece el campo dado por
(13.2-9); para voltajes de polarización lo suficientemente pequefíos, ya sean directos
o inversos, se satisfará la condición (13.2-8). En general, en el rango de polarización
inversa, el factor (eeVofkT- 1) debe tener valores entre cero y -1. Puesto que el
segundo término del denominador anterior es casi siempre pequefío en comparación
con a0 para cualquier valor de polarización inversa, debido al hecho de que
nno ;;¡¡:.. Pno• la magnitud del campo aumentará cuando se incremente la polarización
inversa, llegando a un valor máximo para V 0 ~- oo. En estas condiciones, despre-
ciando el segundo término del denominador por la razón que se acaba de citar,
(13.2-9) adquiere la forma
1 p D (b- 1)e-<x-xo+)/Lp
E=~+nOp . (13.2-10)
qo JliPno + bnno)
Si se usan (13.1-24) y (10.2-11), esto se puede transformar en

kT Pno[1- (b- 1)e-<x-xo+)/Lp] + bnpo ~P


E=-· n (13.2-11)
eLP Pno + bnno

Si Lp -Ln y b -1, la condición (13.2-8) debe satisfacerse en todas partes


dentro de la región n para todos los valores de polarización inversa, ya que si el
material dentro de esta región es bastante extrínseco, nno ;;¡¡:.. Pno, npo. Todos estos
resultados coinciden con la hipótesis original de que el campo era tan pequefío que
podrían desecharse los efectos de todos los transportes excepto el difusivo.
Para valores grandes de polarización directa eeVofkT se hace grande y positivo.
En estas cucunstancias, el segundo término del denominador de (13.2-9) puede ha-
cerse tan grande o mayor que el primero . Dentro del límite de un gran voltaje en
directo4 en el borde de la región de carga espacial (x = x 0 +), (13.2-9) se reduce a

E_ kT b
- eLP b + 1
(t + Pno
npo LP)
Ln
(13.2-12)

4 Por supuesto, en estas circunstancias los coeficientes de transporte ambipolar (10.2-27) y


(10.2-28) deben usarse en las ecuaciones de continuidad, ya que las concentraciones de porta-
dores excedentes pueden ser mayores que la densidad de portadores mayoritarios en equilibrio.
Sin embargo, para materiales donde b es del orden de la unidad, la discrepancia no será lo
suticientemente grande como para invalidar las conclusiones cualitativas que se han derivado.
450 Rectificadores de unión p-n y transistores

y es evidente que (13.2-8) ya no se satisface. En estas circunstancias el papel del


campo puede ser muy importante. En consecuencia, no debe esperarse que la ley de
la corriente y el voltaje (13.1-23) se obedezca a grandes voltajes de polarización
directa. Aunque sólo se ha investigado en detalle la región n del dispositivo, es obvio
que se pueden hacer las mismas observaciones en relación con la región p.
Ya se ha verificado la corrección fundamental del uso de los perfiles de
concentración puramente difusivos (13.1-19) y (13.1-20) en casi todas las condicio-
nes para describir la distribución de portadores en exceso en las regiones n y p de
un rectificador de unión p-n. Ahora es necesario, para completar el cuadro, justificar
la suposición de que la co"iente de portadores minoritarios que fluye dentro de la
región de carga espacial de la unión es puramente de tipo difusivo. Esto se puede
lograr de una manera muy similar. También en este caso, considerando en particular
la región n del dispositivo, (13.2-2) deja ver que la componente difusiva de la
corriente de huecos es mucho mayor que la componente de arrastre, siempre que

(13.2-13)

en donde E está dado por (13.2-9). Si en esta ecuación se substituyen (13.1-20) y


(13.2-9), el resultado es

D
Lp e-<x-xa+)/Lp ~ J.lp(l + (eeYo/kT- l)e-<x-xa+)/Lp)
p

(13.2-14)

Lejos de la umon (x ~xo+), los factores e<x-xo+)/Lp se hacen extremada·


mente pequeños y (13.2-14) se reduce a

(13.2-15)

y es obvio que se viola la condición (13.2-13). Por supuesto, esto es de esperarse


desde el punto de vista puramente físico, ya que por ejemplo, en el caso de la
polarización directa, los portadores minoritarios excedentes que se inyectan en la
unión se recombinan con portadores mayoritarios cuando se difunden cada vez más
lejos de la unión y por esta razón su concentración se hace extremadamente pe-
queña cuando están lejos del plano de la unión. Sin embargo, si la concentración de
portadores minoritarios en exceso se hace pequeña, lo mismo sucede con su gradien-
te y la corriente de difusión que es proporcional a ella. No obstante, la corriente
total debe ser la misma en todas partes de acuerdo con (13.2-4). El déficit resul-
tante en la corriente de difusión lejos de la unión se contrarresta mediante el
incremento correspondiente en la corriente de arrastre que se origina debido a la
presencia de un campo eléctrico. En efecto, es evidente, a partir de (13.2-9), que
cuando se está lejos de la unión el campo eléctrico E se acerca a un valor constante
J0 (ef!Vo/kT- 1)/ a 0 dando origen a una corriente de arrastre puramente óhmica, libre
de cualquier componente de difusión o efecto de portadores en exceso dentro de
esta región. Esto es precisamente lo que la intuición indicaba.
Corrientes y campos en los rectificadores de unión p-n 4S 1

Por supuesto, más cerca de la unión, parte de la componente de arrastre da


origen a una corriente de difusión y, en la unión misma, con contribución relativa
de la componente difusiva puede valorarse haciendo x = x 0 + en (13.2-14), por lo
cual, esa desigualdad se reduce a

(13.2-16)

Si se sigue una línea de razonamiento similar a la que se usó previamente en


relación con (13.2-14), se puede demostrar que cuando LP -Ln y b,.., 1, (13.2-16)
se satisface a todos los valores de volt.tje de polarización inversa y para pequeños
voltajes de polarización directa. También, al igual que antes, para grandes voltajes de
polarización directa, esta condición puede violarse. Nuevamente (excepto a grandes
valores de polarización directa) estos resultados son consistentes con el punto de
vista original, de que casi toda la corriente de portadores minoritarios que fluye
hacia la región de carga espacial de la unión es de difusión. El resultado se ha
comprobado explícitamente sólo para la región n; pero es evidente que pueden
formularse conclusiones similares para la región p. De donde, se justifica la conclu-
sión establecida de que, aunque los resultados de los cálculos de la sección anterior
revelen que hay campos eléctricos en las regiones volumétricas, en contradicción con
la hipótesis original en la que se basaron dichos cálculos, en la región de polariza-
ción inversa o baja polarización directa, los campos son tan reducidos que no hay
contradicciones importantes a la suposición del transporte difusivo de los portadores
minoritarios. 5 Los cálculos realizados en estas circunstancias son totalmente con-
gruentes. Para valores mayores de voltaje de polarización directa, los campos calcu-
lados se hacen tan grandes que amenazan esta congruencia y ya no se puede tener la
seguridad de que siga siendo válida la suposición inicial de que el transporte de
portadores minoritarios es puramente difusivo dentro de las regiones volumétricas p
y n del dispositivo. En el siguiente capítulo se estudiarán las propiedades de los
rectificadores p-n en estas condiciones de un modo más detallado.
Ya se hizo notar en relación con (13.2-15), que dentro de las regiones volumé-
tricas, las componentes difusiva y de arrastre de la corriente total no son iguales en
todas partes a pesar de que la corriente total propiamente dicha es constante en
ellas. Se puede hacer la misma observación sobre las componentes de la corriente
de huecos y electrones. Por ejemplo, de acuerdo con la figura 13.4(a), es obvio
que en el lado n cerca de la unión, la corriente de huecos es mucho mayor (en
vista de la gran componente difusiva) que lejos de la unión, en donde los huecos
escasean y en donde la corriente de huecos es casi exclusivamente de arrastre. En
vista del requisito de que la corriente total sea la misma en todas partes, es evi-
dente que la corriente electrónica cerca de la unión debe ser correspondientemente
más pequeña que lejos de ella en la parte volumétrica del cristal. Este equilibrio
se mantiene por medio del campo E, dado aproximadamente por (13.2-9), que
tiene un efecto mucho más importante en las corrientes de portadores mayoritarios
(debido al número mucho mayor de portadores mayoritarios presentes), que en las
corrientes de portadores minoritarios que, como se demostró antes, tiene una natu-
raleza más bien difusiva.

S Por supuesto, en algunos casos y debido a las caídas óhmicas dentro de las regiones
volumétricas p y n, ya no se podrá identificar a V0 como el voltaje total aplicado, sino sólo
como la caída que se produce en la región de la unión.
452 Rectificadores de unión p-n y transistores

13.3 RECTIFICADORES DE UNION DE TAMAÑO FINITO;


EFECTOS DE SUPERFICIE Y TERMINALES OHMICAS

Los resultados de la secc10n anterior, aunque se derivaron para un dispositivo


de extensión infmita a lo largo del eje x, se pueden aplicar perfectamente a disposi-
tivos de tamaño finito, con la única condición de que las regiones reales n y p sean
muchas veces más gruesas que las longitudes de difusión respectivas Lp y Ln, y que
la cantidad V 0 se considere como el voltaje aplicado a la región de carga espacial de
la unión y no como el voltaje aplicado a todo el dispositivo. Si los espesores de una
o las dos regiones volumétricas adyacentes a las capas de carga espacial de la unión
son del orden de la longitud de difusión en dicha región, o menores que ésta, es
necesario modificar las cálculos de la sección 13.1. Para ver cómo se hace, estúdiese
primero el rectificador que aparece en la figura 13.6(a), en donde la estructura
del dispositivo se termina por medio de dos superficies libres con velocidades de
recombinación superficial sp y sn. Se supone que el dispositivo es grande en las
direcciones y y z, de tal manera que se pueden escribir ecuaciones de continuidad
unidimensionales de la forma (13.1-7) y (13.1-8). Aunque la forma general de las
soluciones tal como la expresan (13.1-14) y (13.1-15) sigue siendo válida, es más
conveniente escribir las soluciones como sigue

X+ X 0 _ X+ Xo-
np- npo = A cosh + B senh L (x <O) (13.3-1)
L. n

X- Xo+ X- Xo+
p.- P.o = C cosh + Dsenh L (x > 0). (13.3-2)
LP P

Se puede demostrar fácilmente que estas soluciones satisfacen las ecuaciones


(13.1-7) y (13.1-8). Las condiciones de frontera (13.1-17) y (13.1-18) siguen siendo
aplicables en los bordes de la unión en x 0 + y en - x 0 _; pero ahora, las condi·
ciones de frontera (13.1-10) y (13.1-11) deben substituirse con las condiciones super·
ficiales de frontera

(13.3-3)

(13.3-4)

Al igual que antes, las anteriores ecuaciones de continuidad se pueden resolver


con las nuevas condiciones de frontera, para obtener la concentración de portadores
en exceso y las corrientes de difusión de portadores minoritarios en los bordes de
las regiones de carga espacial de la unión se pueden encontrar y combinar exacta-
mente como se hizo en la sección 13.1, para obtener la corriente total que fluye
por la unión. En ambos casos se hacen las mismas aproximaciones con respecto al
transporte difusivo de portadores y desechando la generación y recombinación dentro
de la región de carga espacial. Al utilizar las condiciones de frontera (13.3-3) y
(13 .3-4) los resultados del cálculo son

Pn- Pno = Pno ( eeYo/kT - >[


1 cosh X-Xo+
- (. senh X-Xo+]
(región-n) (13.3-5)
LP LP
Rectificadores de unión de tamaño finito 453

+
dp 1 dn
1

q,-x +x x
0 0_ 0 d.-x 0+
tipo-p
1
1
Contacto
1 1 metálico 1
-sc +se
1
l "óhmico" metálico
Superficie, 1
"óhmico"
velocidad de 1 1 Superficie, X
0-
_j
recombinación tipor 1 tipo-n
Sp velocidad de
recombinación s. x=O -x
1 Unión
x=O
--x
Unión
(a) (b)

Figura 13.6. (a) Geometría del rectificador fmito p-n que se vio en la sección 13.3. (b)
Geometría de un rectificador fmito típico p-n que se puede producir mediante
procesos de aleación o difusión.

(región-p) (13.3-6)

en donde

(13.3-7)

(13.3-8)

mientras que la ecuación de la corriente es


¡ = I~(eeVo/kT _ 1) (13.3-9)

y
/' -
o- e
(npoD. r
L ~P
+ P.oDp r)
L ~• . (13.3-10)
• p
454 Rectificadores de unión p-n y transistores

La característica de corriente y voltaje obtenida de esta manera tiene la misma


forma que la que se derivó para el dispositivo infmito, excepto que la corriente de
saturación está modificada por los factores ~P y ~n, que comprenden las longitudes
de difusión, las velocidades de recombinación y los espesores de las capas volumé-
tricas. Si sn =Dp/Lp, se observará que ~n = 1 y (13.3-5) se reduce a (13.1-20). La
región n del dispositivo termina con una superficie cuya velocidad de recombinación
es igual a esta velocidad característica de difusión Dp/Lp; esto hace que la distri-
bución de portadores de carga sea exactamente la misma que si esta región del
dispositivo tuvier.a una extensión infinita. Si además sp = Dp/Lp, entonces (13.3-6) se
reduce en la misma forma a (13.1-19) y

ló = 10 (13.3-11)

en donde / 0 es la corriente de saturación del diodo infinito, tal y como está dada
en (13.1-24). Si sn >Dp/Lp y sp >Dn/Ln, entonces, ~n y ~P tendrán valores mayores
que la unidad, y la corriente de saturación sobrepasará a la del dispositivo infmito:
si Sn <Dp/Lp y Sp <Dn/Ln, ~n y ~P serán menores que la unidad y la corriente
de saturación será más pequeña que la del dispositivo infinito. En el límite en donde sn
y sp tienden a cero, se puede escribir

(s" = sP =O) (13.3-12)

en tanto que, si sn y Sp son grandes en comparación con las velocidades caracterís-


ticas de difusión respectivas, la corriente de saturación se convierte en

Los contactos extremos metálicos y "óhmicos" de área grande que se utilizan con
frecuencia como terminales extremas, como se ilustra en la figura 13.6(b), se com-
portan casi siempre en la misma forma que las superficies con una velocidad de
recombinación extremadamente alta. Es razonable esperar este comportamiento desde
un punto de vista físico, ya que un contacto que es eléctricamente óhmico no
inyectará corrientes de portadores en exceso. En efecto, debe actuar de tal manera
que mantenga la concentración de portadores en equilibrio en la región adyacente del
semiconductor. Sin embargo, así se comporta una superficie con una velocidad de
recombinación muy alta, de acuerdo con la ecuación (10.5-14). Por tanto, la ecua-
ción (13.3-13) puede aplicarse a la estructura del rectificador que aparece en la
figura 13 .6(b ).
Al incrementar el voltaje de polarización inversa en este tipo de dispositivos,
las capas de carga espacial aúyacentes a las uniones se extienden más y más dentro
de las regiones volumétricas p y n. Entonces, las distanciasdp- x 0 _ y dn- x 0 +
varían con el voltaje de acuerdo con (12.4-21) y (12.4-22), y se observa que la
corriente de saturación (13.3-10) depende en parte del voltaje aplicado al igual que
de los otros parámetros que aparecen ahí. Cuando dn y dp son grandes en compara-
ción con el valor más alto que x 0 + o x 0 _ pueden tener antes de llegar a la
condición de ruptura, esta variación de la corriente de saturación con el voltaje de
polarización es insignificante; pero si x 0 + o x 0 _ llegan al orden de dn o dp a un
voltaje aplicado que pueda lograrse en la práctica, entonces el efecto puede ser muy
importante. Si la velocidad de recombinación en la terminal extrema es muy alta,
Rectificadores de unión de tamaño finito 455

entonces, de acuerdo con (13.3-13), la corriente de saturación puede hacerse extre-


madamente grande conforme la región de carga espacial tiende hacia el contacto
extremo, ya que lím ctnh x = uo. Por tanto, se observa un efecto algo similar a la
x-+0
ruptura, aunque (como se verá más tarde) las causas físicas de la verdadera ruptura
se basan en las propiedades físicas volumétricas del semiconductor, en tanto que el
efecto antes citado, que se denomina perforación, depende en forma crítica de las
dimensiones del dispositivo.
Se puede lograr una comprensión física de la perforación recordando que la
corriente de saturación de un rectificador p-n es la corriente que se origina debido
a la recolección de portadores minoritarios térmicamente generados que efectúa la
unión con polarización inversa. Sin embargo, de acuerdo con (10.5-6), el flujo de
equilibrio de los portadores térmicamente generados producido en una superficie con
una alta velocidad de recombinación, es muy grande. De donde, si el borde de la
región de carga espacial de la unión se acerca a una superficie con una alta veloci-
dad de recombinación (o un contacto metálico óhmico que se comporta de un
modo muy semejante), la corriente inversa se incrementa enormemente debido a este
flujo superficial de generación térmica. Si la capa de carga espacial está separada de
la superficie o del contacto por una región volumétrica de espesor apreciable, los
portadores generados en la superficie deben difundirse a cierta distancia antes de ser
recogidos; pero pueden recombinarse durante el tiempo que necesitan para difundirse
hasta la unión. En estas condiciones, el flujo recogido por la unión puede ser mucho
menor que el flujo inicial de generación superficial y, en consecuencia, la corriente
inversa de la unión será más pequeña. Si la región de carga espacial de la unión está
a muchas longitudes de difusión de la superficie o del contacto, se puede hacer caso
omiso del incremento en la corriente de saturación debido a la generación superficial.
Por lo general, los efectos de perforación deben evitarse haciendo que las
regiones p y n sean lo suficientemente gruesas para que la verdadera ruptura volumé-
trica se produzca antes de que las capas de carga espacial lleguen a los contactos
extremos. Sin embargo, en algunas ocasiones se utiliza el efecto de perforación de
manera intencional para obtener un dispositivo que tenga un incremento abrupto en
la corriente de saturación, a un voltaje inverso específico, que se puede utilizar
como un elemento regulador de voltaje. En la figura 13.7 se ilustra la característica
de corriente y voltaje de un diodo de perforación de este tipo.

la corriente de
saturación aumenta
gradualmente con el
voltaje de polarización inversa
Perforación

Figura 13. 7. Relación corriente-voltaje de un rectificador p-n de tamaño finito, en donde se


ilustra el efecto de "perforación".
456 Rectificadores de unión p-n y transistores

13.4 MECANISMOS FISICOS DE RUPTURA


EN LAS UNIONES p-n

El fenómeno de perforación es un efecto semejante al de ruptura; pero su


mecanismo se relaciona con las características estructurales del dispositivo más que
con las propiedades físicas volumétricas del cristal. Sin embargo, existen dos meca-
nismos importantes por medio de los cuales se puede producir la verdadera ruptura
de cristal y que son el mecanismo Zener6 y el mecanismo de avalancha. 7
La ruptura Zener se relaciona con el fenómeno de la emisión de campo, en la
que los electrones se emiten desde un cátodo metálico frío mediante la creación de
un campo extremadamente alto en la superficie del cátodo. El efecto se puede
comprender basándose en la formación de un túnel de electrones en el nivel de
Fermi del metal o cerca de éste, a través de una barrera de potencial superficial.
como se ilustra en la figura 13.8. En esta figura, la superficie de un metal ideal de
electrQnes libres aparece en (a), en ausencia de campos externos; la función de
trabajo del metal es 1/Jo. Si se aplica un voltaje externo tal que el metal sea negativo
con respecto a un electrodo externo, se tendrá un campo E entre los dos electrodos.
que será constante en una geometría de plano paralelo. El potencial correspondiente
tendrá la forma tjJ(?c) =-Ex+ const, como se ilustra en (b). Al incrementar la
diferencia de potencial que se aplica externamente, la pendiente del potencial se
hace cada vez mayor hasta que sólo existe una pequeña distancia entre los electrones
cercanos al nivel de Fermi del metal y los estados permisibles de la misma ene(gía
que está fuera del metal. En estas circunstancia:., los electrones libres del metal
pueden formar un túnel a través de la delgada barrera de potencial superficial, creando
una corriente de emisión de campo entre los dos electrodos. Se requieren campos ex-
ternos muy elevados para producir corrientes de emisión de campo apreciables; con
campos bajos, la barrera de potencial superficial es tan ancha que la probabilidad corres-
pondiente de establecer un túnel es dt>spreciable.
Debe hacerse notar que este es un efecto superficial primordialmente y que el
campo dentro del metal es muy pequeño debido a la gran conductividad.
En la práctica, en un aislador o semiconductor se pueden obtener campos
eléctricos internos muy elevados. En tales condiciones, existen gradientes impor-
tantes dentro del cristal y la energía potencial de un electrón en la base de la banda
de conducción, por ejemplo, es menor en un extremo del cristal que en el otro.
Cuando las bandas de energía se grafican en la forma acostumbrada, en función de
la distancia en la dirección del campo, tienen la inclinación que se indica en la
figura 13.9. Si el campo aplicado y, por ende, la pendiente de las bandas, es lo
suficientemente grande, sucederá que, entre los electrones situados en la parte supe-
rior de la banda de valencia y los estados desocupados de igual energía en la base
de la banda de conducción, la barrera de energía potencial se hace muy angosta y se
puede producir la formación de túnel en el interior del cristal, como se señala en la
figura 13.9. En realidad, este efecto es una emisión de campo interno; el mecanismo
antes descrito fue propuesto por Zener6 en 1934, para explicar el fenómeno de la
ruptura eléctrica volumétrica o semiconductores.
En cristales uniformes de silicio o germanio (excepto a temperaturas muy bajas
cuando los portadores provenientes de los donadores y receptores se "congelan"), es
imposible obtener campos eléctricos lo suficientemente altos para observar una rup-
tura volumétrica Zener sin que el cristal se funda debido a un calentamiento óhmi-
co. Sin embargo, en una muestra que contiene una unión p-n, existe un campo

6 C. Zener, Proc. Roy. Soc. (Londres), 145, 523 (1934).


7 K. G. McKay y K. B. McAfee, Phys. Rev., 91 1079 (1953).
Mecanismos físicos de ruptura en los uniones p-n 457

Túnel de electrones
a través de una
-e4>(xl t barrera delgada

~~~~·'
~
~Electrones E•O E>O E grande
~libres
~
Metal Vacío Metal Vacío Metal Vacío
(a) (b) (e)

Figura 13.8. Diagrama de potencial cercano a la superficie de un metal, en donde se muestran


las etapas sucesivas conforme se incrementa gradualmente un voltaje aplicado des-
de fuera. En (e) se produce la emisión de campo y los electrones del interior del
metal forman un túnel a través de la delgada barrera superficial.

eléctrico inherente en la umon, y la magnitud de dicho campo puede incrementarse


de gran manera aplicando al dispositivo un voltaje de polarización inversa, como se
ilustra en la figura 13.10. Es evidente que la inclinación de las bandas de energía en
la unión p-n con polarización inversa da origen a una situación (análoga a la que
se presenta en la figura 13.9(c) para una muestra volumétrica), en que la formación
de túnel puede producirse cuando la barrera de potencial que separa a los electrones
en la parte superior de la banda de valencia de los estados desocupados de la banda
de conducción de igual energía se hace lo suficientemente delgada. Generalmente,
esta condició11 se obtiene sólo mediante la aplicación de una polarización inversa a la
unión; pero se obtiene con mayor facilidad en las uniones abruptas p-n, en donde
la caída total de potencial se confina a una distancia mínima y en estructuras Cle

Barrera de potencial
que separa al electrón
en A del estado vacío
de conducción de
igual energía en
·~------..---
B-----...: 1
~,..~
",..
1 ",..
1 ~,..
e:.. 1 ",..B

··w,aÉÍ~~tr'o'~is~A
E=O
-x

(a) (b) (e)

Figura 13.9. Diagrama de potencial de un semiconductor volumétrico uniforme que presenta las
etapas sucesivas conforme se incrementa en forma gradual un voltaje aplicado
externamente. (e) La emisión interna de campo se produce y los electrones for·
man un túnel a través de la delgada barrera de potencial, desde la banda de
valencia hasta la de conducción.
458 Rectificadores de unión p-n y transistores

··n:_ !l.
ti po-n

(a) Polarización cero

(b) Alta polarización inversa

Figura 13.10. Diagrama de potencial de una unión p-n (a) con polarización cero, (b) con una
alta polarización inversa. En (b) se produce la ruptura Zener, cuando los electro-
nes establecen un túnel a través de la delgada barrera, desde la banda de valencia
a la de conducción.

unión en donde tanto la región p como la n tienen una fuerte impurificación, dando
también como resultado (de acuerdo con la ecuación (12.4-24) y las cifras de la
tabla 12.1) regiones de carga espacial de la unión que son muy angostas, en donde
existen campos elevados internos incluso a un voltaje aplicado de cero.
En el mecanismo de avalancha, la ruptura de la unión se produce cuando los
electrones y los huecos adquieren la suficiente energía entre colisiones, proveniente
de un campo eléctrico elevado, en la región espacial de la unión, para crear pares
electrón-hueco, debido a la ionización por impacto de los enlaces covalentes de red.
Este efecto es similar a la ionización de avalancha Townsend para un gas, en donde
los electrones dentro de un medio gaseoso adquieren la suficiente energía, entre
colisiones, a partir de un campo aplicado para ionizar los átomos con los que
chocan. Los electrones y los huecos que se crean de esta manera, pueden a su vez.
adquirir la suficiente energía del campo para crear otros pares por ionización de
impacto, iniciando una reacción en cadena que lleva a corrientes inversas muy ele-
vadas.
Para que se. produzca una avalancha, un electrón o un hueco debe adquirir la
suficiente energía del campo al recorrer una distancia del orden de la trayectoria
libre media para crear un par electrón·hueco. Entonces, se llega a la condición para
una ruptura de avalancha cuando el campo en la región de la unión alcanza un valor
crítico Eb tal que

o bien,

(13.4-1)
Mecanismos físicos de ruptura en las uniones p-n 459

En el germanio y el silicio, la trayectoria libre media a la temperatura ambien-


te es del orden de 10- 5 cm y, por tanto, puede esperarse que la ruptura de avalan-
cha se produzca sólo cuando la intensidad del campo en la región de la unión
exceda de aproximadamente 100 kV/cm. De igual manera, puesto que en todos los
cristales excepto los muy impuros, la trayectoria libre media se determina por las interac-
ciones con fonones y, dado que al aumentar la temperatura se incrementa también
el número de fonones disponibles, la trayectoria libre media por la dispersión con
fonones disminuye, al aumentar la temperatura. En consecuencia, el campo y el
voltaje en la ruptura por avalancha aumentan (aunque con mucha lentitud) al incre-
mentarse la temperatura. Esto contrasta notablemente con el campo de ruptura
Zener que es prácticamente independiente de la temperatura, ya que sólo depende
de la banda de energía prohibida y el espesor de la barrera de túnel.
El voltaje real de la ruptura de avalancha para una unión abrupta se puede
obtener en forma aproximada observando, de acuerdo con (13.4-I) y (12.4-24) que
si Vb es el voltaje de ruptura y si Vb ~ r/> 0 , se puede escribir

( 13.4-2)

de donde, vb está dado por

vb = K(Llc)z (__!_ + _!_). ( 13.4-3)


8n:e 3 A2 Nd Na
También en este caso se observa que las densidades de impurificación relativa-
mente leves producen voltajes de ruptura elevados y viceversa. Así también, se pre-
fiere usar materiales con grandes bandas de energía prohibida para dispositivos que
deben resistir ur.a ruptura de avalancha a altos voltajes inversos.
El tipo de ruptura que se produce en un dispositivo dado depende en gran
parte del material y los parámetros estructurales del dispositivo, así como de las
condiciones en las que opera. En general, los dispositivos con uniones muy abruptas
y con densidades de impurificación muy grandes a ambos lados de la unión, sufren
la ruptura por el mecanismo Zener, en tanto que los dispositivos con uniones gra-
duales o con uniones abruptas, en las que una de las regiones posee sólo una
impurificación moderada, el mecanismo de avalancha es el dominante. En algunas
ocasiones, dispositivos que presentan la ruptura de Zener a la temperatura ambiente,
sufren también una ruptura de avalancha cuando operan a temperaturas mucho más
bajas, debido al incremento en la trayectoria libre media. Muss y Greene 8 descubrie-
ron que las uniones abruptas p-n en el germanio en donde la concentración de
impurificación de la región p es muy alta (aproximadamente 10 18 cm- 3 ), presentan
a la temperatura ambiente una ruptura Zener, cuando la concentración de donadores
Nd en el lado n es mayor que alrededor de 3 X 10 15 cm- 3 , los dos mecanismos en forma
simultánea para 3x 10 15 cm- 3 >Nd>7.5x 10 14 cm- 3 , y la ruptura de avalancha
para Nd < 7.5 x 10 14 cm- 3 .
Si las uniones p-n de semiconductores se diseñan y fabrican debidamente, se
pueden obtener características de ruptura muy nítidas, haciéndose con precisión y en
forma reproducible a un voltaje dado, que puede ser insensible a la temperatura.
Estos dispositivos se pueden emplear como diodos de voltaje de referencia y las
unidades diseñadas con este fin en particular se denominan "diodos Zener", aunque
a pesar de la nomenclatura, el mecanismo de ruptura que utilizan es a menudo el
efecto de avalancha.

8 D. R. Muss y R. F. Greene, J. Appl. Phys., 29, 1534 (1958).


460 Rectificadores de unión p-n y transistores

13.5 TECNICAS DE FABRICACION DE LA UNION p-n

En esta secc10n se revisarán brevemente los aspectos tecnológicos más impor-


tantes de la fabricación real de la unión p-n. Este estudio se limitará en gran parte
a los aspectos cualitativos del tema, ya que para analizar rigurosa y cuantitativa-
mente los problemas que se presentan necesitaríamos introducir conceptos de fisi-
coquímica y metalurgia que quedan fuera del alcance de esta obra. No obstante, se
espera que este análisis proporcione al lector conocimientos suficientes sobre los
principios físicos necesarios.
Desde el punto de vista experimental existen tres formas principales de pre-
parar dispositivos de unión p-n; el método de crecimiento de unión, el de aleación
y el de difusión. En el método de crecimiento de unión, se hace crecer un cristal
semiconductor, por ejemplo, a partir de un fundido que inicialmente es de tipo n y
que, mientras el cristal se está formando, se vuelve a impurificar agregando las
suficientes impurezas receptoras de tal manera que la porción del cristal que crece
posteriormente sea tipo p. La unión resultante es más bien de tipo gradual que
absoluto. Aunque se puede observar un control preciso de las concentraciones de
impureza a ambos lados de la unión por este método, la dificultad para localizar la
unión en el cristal crecido y el problema que representa unir conductores a las
regiones angostas de la unión crecida, han impedido que se generalice esta técnica de
elaboración. Sin embargo, tiene cierta importancia histórica ya que los dispositivos
de unión p-n se prepararon originalmente mediante este proceso.
En el método de aleación se usa un pequeño trozo u hoja de material para la
aleación, que se fusiona sobre el cristal base del semiconductor. El trozo de material
contiene las impurezas que darán origen al tipo de conductividad opuesto al del
cristal original; una vez que se ha fundido, se eleva la temperatura a un valor lo
suficientemente alto para permitir que el material fundido disuelva hasta cierto pun-
to el cristal semiconductor subyacente, como se indica en la figura 13.1l(b). La fase
líquida es, entonces, una solución del material semiconductor dentro de la aleación
líquida que se satura más o menos a la temperatura máxima de fabricación. Puesto
que la solubilidad de equilibrio del semiconductor en el metal líquido aumenta
normalmente con la temperatura, cuando el dispositivo se enfría con lentitud, la

Trozo de indio In + Ge disuelto In + Ge disuelto

cSb' ~~~
a 200"C

Unión
T= soo•c T = 200"C
(o) (b) (e)

Aleación de In solidificada

T = 20"C
(d)
Figura 13.11. Etapas sucesivas de la fabricación de un rectificador p-n de aleación.
Técnicas de fabricación de la unión p-n 461

solución se supersatura con respecto al soluto y algunos átomos de semiconductor


disuelto se recristalizan en la interfaz líquido-sólido continuando la estructura de un
solo cristal de substrato. Puesto que la fase líquida contiene las impurezas asociadas
con el tipo de conductividad opuesto al del cristal original, el material recrecido
tendrá una conductividad opuesta y se produce una unión p-n en la interfaz del
material original y el recrecido. Con un enfriamiento subsecuente, toda la fase de
aleación se solidifica y, entonces, el problema de establecer las conexiones eléctricas
en el cristal original y en el trozo de aleación resolidificado, es cuestión sencilla.
Este proceso se ilustra esquemáticamente en la figura 13.11.
En la práctica, las uniones p-n se pueden fabricar con facilidad utilizando
germanio tipo n como material base e indio puro (punto de fusión 156°C) como
agente de aleación. En este caso, la capa recristalizada estará saturada de indio
haciendo que esta región sea tipo p y, a decir verdad, de un fuerte tipo p. Si el
material de base es germanio tipo n con un contenido moderado de impureza, el
dispositivo es fuertemente asimétrico y la región p tiene una impurificación mucho
más marcada que la n. Se pueden obtener concentraciones de impureza mucho más
altas en la región p incorporando una pequeña cantidad de galio al indio, ya que la
solubilidad en equilibrio en fase sólida del galio en el germanio es mayor que la del
indio. 9 Las capas n recristalizadas se pueden formar sobre cristales de germanio tipo
p de un modo similar, utilizando hojuelas o trozos de aleaciones de plomo y anti-
monio, o estaño y antimonio. En cristales de silicio, las uniones por aleación se
pueden lograr utilizando hojuelas o trozos de aluminio u oro-antimonio.
Los procesos de aleación proporcionan casi siempre uniones muy abruptas.
Esto es muy apropiado para los requisitos de fabricación; en particular, es muy
sencillo hacer simultáneamente dos uniones a ambos lados de un cristal delgado,
formando así una estructura de transistores p-n-p o n-p-n al que se pueden suje-
tar con suma facilidad los cables de emisor, base y colector (véase la figura 13.12).
Aunque a veces es dificil ejercer un control dimensional estricto en dispositivos
fabricados por el p1 oceso de aleación, la facilidad y simplicidad de la técnica ha he-
cho que se utilice profusamente como método de producción para muchos tipos dife-
rentes de dispositivos.
En el método de difusión, se utiliza un elemento de impureza que se difunde
a una temperatura elevada dentro de un cristal cuya conductividad es opuesta a la
que se produce debido a la presencia de la impureza de difusión en la red cristalina.
La profundidad de la unión localizada por debajo de la superficie del cristal y el
gradiente de concentración de impureza en la unión se puede controlar regulando el
tiempo de difusión y la temperatura, así como la concentración superficial de la
impureza de difusión. Si c(x,t) es la concentración de la impureza de difusión a una

Figura 13.12. Diagrama de la sección transversal de un transistor p-n-p de aleación.

9 Es relativamente sencillo calcular las verdaderas concentraciones de impurezas de la re-


gión p obtenidas, por medio de los diagramas de fase en equilibrio. Al final del capítulo hay un
ejercicio sobre este tema.
462 Rectificadores de unión p-n y transistores

profundidad x por debajo de la superficie y después de un tiempo de difusión t, y


si D es el coeficiente de difusión para la difusión de la impureza dentro del cris-
tal,10 entonces c(x,t) se puede determinar como la solución de la ecuación de
difusión

(13.5-1)

En cuanto a las condiciones de frontera, se puede suponer que la concentra-


cwn superficial c(O,t) es un valor constante dado c 0 para todos los valores de t, de
donde,
c(O,t) = c0 = const, (13.5-2)

y también que
lim c(x,t) = O. (13.5-3)

La solución que satisface estas condiciones de frontera es

c(x,t) = c0 erfc(J~Dt) (13.5-4)

en donde
2cx fx
erfc cxx = l - erf cxx = 1 - J1r. 0
2 •2
e-~ x dx'. (13.5-5)

El perfil de concentración después de cualquier tiempo de difusión dado se


puede calcular a partir de (13.5-5). La unión p-n se encontrará en el punto en
donde c(x,t), que es la concentración de impurezas de difusión según lo establece
(13.5-5), es igual a la densidad de impurezas que estaban presentes originalmente en
el cristal. En la figura 13.13 se presenta una familia típica de perfiles de concen-
e (x,t)

' Posición de la umon


correspondiente a distintos
tiempos de difusión
Figura 13.13. Representación esquemática del perfil de concentración de impurezas dentro de
un rectificador difundido, a diferentes tiempos de difusión.

10 El coeficiente de difusión D que se usa aquí no debe confundrrse con los coeficientes
de difusión Dn y Dp para electrones y ruccos. El coeficiente de difusión que aquí se estudia es
el que se relaciona con la difusión de impurezas de substitución en la red mediante un meca-
nismo de vacantes que se vio en el capítulo 11, y es mucho más pequeño que Dn y Dp: Los
valores típicos de las impurezas comunes de substitución en el Ge están dentro del rango de
10 -12 - 10 -13 cm2fseg a temperaturas de 800°C.
Transistores de unión p-n-p y n-p-n 463

tración, según lo que establece la ecuación anterior, para varios valores distintos de
tiempo de difusión. En esta figura se indican también las posiciones sucesivas de la
unión para cada valor de tiempo de difusión.
Las uniones fabricadas por difusión pueden ser graduales o muy abruptas,
dependiendo del tiempo de difusión, la concentración superficial y la densidad de
impurezas en el cristal original. Aunque la adición de los cables a las capas difun-
didas presenta ciertos problemas técnicos, la facilidad y precisión con que se puede
controlar el espesor de las capas difundidas ha conducido al uso generalizado de la
difusión como técnica de fabricación. En la figura 13.14 se ilustran las etapas de la
producción de un transistor difundido p-n-p.

Material rebajado
mediante el ataque

p- Ge
J c----P----:) l"fmfco ~
(O) (bl (el

~ :~
n
p
n

(d)

Figura 13.14. Etapas sucesivas de Ia fabricación de un transistor n·p-n por difusión.

13.6 TRANSISTORES DE UNION p-n-p Y n-p-n

Una estructura semiconductora que tiene un electrodo de emisor para inyectar


portadores minoritarios excedentes al cristal semiconductor y un electrodo colector
para recuperarlos, se conoce con el nombre de transistor y se puede fabricar para
que amplifique corrientes o señales de voltaje, se use como oscilador o dispositivo de
conmutación. Los electrodos de emisor y colector pueden ser puntas de contacto o
uniones p-n. El transistor original, tal como lo inventaron Shockley, Bardeen y
Brattain (1948), tenía puntas de contacto para el emisor y el colector; pero estos
dispositivos han sido superados por completo en el mercado comercial por los tran-
sistores de unión p-n, que fueran inventados por Shockley (1950). En realidad el
aparato de Haynes-Shockley para medir la movilidad de los portadores inyectados es
un transistor y se puede emplear de un modo muy conveniente para entender los
principios del funcionamiento del transistor. En la figura 13.15 se muestra un dia-
grama simplificado de este dispositivo.
Supóngase que se hace fluir una corriente uniforme de emisor le en sentido
directo desde el electrodo emisor de este diagrama, por medio de un voltaje de
polarización directa Ve. Se inyectan huecos al cristal semiconductor (que en este
caso se supone tipo n) que se desplazan hacia el electrodo colector y son recogidos
ahí por medio del colector con polarización inversa, haciendo que fluya una corrien-
te de colector le a través del circuito de colector y una resistencia de carga a tierra.
464 Rectificadores de unión p-n y transistores

Figura 13.15. Diagrama esquemático de un transistor de puntas de contacto y su circuito exter-


no. La batería de barrido conectada a la base del dispositivo no' se necesita para
la operación del transistor; pero se incluye en este diagrama simplemente para
demostrar la relación de la estructura con la del transistor de filamentos de
Haynes-Shockley del capítulo lO.

El voltaje de emisor Ve requerido para hacer que fluya la corriente en el circuito de


emisor, puede ser mucho más pequeño que el voltaje inverso Ve que se aplica al
colector. Así si casi todos lo huecos emitidos llegan al electrodo colector, 11 la
corriente de colector será casi igual a la de emisor. Por tanto, es obvio que un
pequeño cambio en la corriente de emisor, producido por una pequeña entrada de
potencia en el emisor, puede originar casi el mismo cambio en la corriente de colee·
tor que fluye a través de un circuito de una impedancia mucho mayor en el que se
mantienen voltajes más elevados, y producir un cambio grande en la potencia que
pasa a la resistencia de carga.
Esto se puede demostrar de un modo más cuantitativo expresando la corriente
de emisor en función del voltaje de emisor mediante la ecuación 12
(13.6-l)

en donde leo es la corriente de saturación del emisor. Del mismo modo, se puede
escribir la siguiente relación de corriente-voltaje en el colector

(13.6-2)

en donde leo es la corriente de saturación, asociada con el colector y a representa


la fracción de la corriente de emisor que se recupera subsecuentemente como co-
rriente de portadores minoritarios en el colector. En esta ecuación, el primer término
representa la componente de la corriente de colector debida a la recuperación nor-
mal de portadores minoritarios que se generan térmicamente dentro del cristal semi-

11 En el experimento Haynes-Shockley, si el objetivo es medir con precisión las concentra-


ciones de los portadores en exceso y los tiempos de arrastre, la fracción de portadores minorita-
rios que recoge el colector se mantiene baja intencionalmente para no modificar las caraterísticas
de difusión del sistema que se investiga. No obstante, en cualquiera de estos sistemas que se·usa
como transistor, el propósito es recoger una fracción de portadores minoritarios inyectados tan
grande como sea posible para aumentar al máximo el factor de amplificación asociado con el
dispositivo.
12 Se ha establecido claramente que una relación corriente-voltaje de esta forma es la que
debe esperarse de una unión p-n en el emisor. Sin embargo, en un capítulo posterior se verá
que puede esperarse una relación de la misma forma en un rectificador de puntas de contacto.
Se puede llegar a conclusiones similares en conexión con la relación corriente-voltaje del elec-
trodo colector.
Transistores de unión p-n-p y n-p-n 46S

conductor, mediante el electrodo colector con polarización inversa, en tanto que la


segunda representa la componente adicional creada por los portadores minoritarios
inyectados en el emisor y que después recoge el colector. En un transistor bien
diseñado, el factor a es muy cercano a la unidad; pero no puede ser igual por
completo ni superarla, debido a que parte de los portadores minoritarios inyectados
por el emisor no podrán llegar al colector a causa de la recombinación en la parte
volumétrica del cristal semiconductor o en la superficie de éste. En el funcionamien-
to normal del transistor, la corriente de emisor se mantiene a un valor mucho mayor
que leo y el colector tiene una polarización inversa profunda dentro de la región de
saturación; en estas condiciones, las ecuaciones (13.6-1) y (13.6-2) pueden escribirse
más o menos como sigue

(13.6-3)

(JVcl ~ kT/e). (13.6-4)

La ecuación (13.6-3) se puede expresar como sigue

kT 1,
V,=-ln-, (13.6-5)
e 1,0

y, de acuerdo con esto, es evidente que una pequeña vanac10n de la corriente de


emisor die ~e relaciona con una variación dVe en el voltaje de emisor de acuerdo
con

dV = kT di, (13.6-6)
' e l, ·

El cambio correspondiente en la potencia de entrada en el circuito del emisor


está dado por

dP, = d(l,V.) = I, dV, + V, di,= kT (1 + ln ~)di,. (13.6-7)


e 1,0

Sin embargo, en el circuito de salida o colector se tiene que, de acuerdo con


(13.64),

(13.6-8)

y, puesto que la potencia entregada a la resistencia de carga es P1 = I'f:R 1, se tiene


que

(13.6-9)

en donde le y die se han relacionado con le y die por medio de (13.64) y


(13.6-8 ). No obstante, si a eo:: 1 y le~ leo, como sucede casi siempre, el primer
término de (13.6-9) es mucho más pequeño que el segundo y, por ende, puede
desecharse, de donde, la ecuación se reduce a

( 13.6-101
466 Rectificadores de unión p-n y transistores

Si die se expresa en función de la potencia de entrada dPe por medio de


(13.6-7), la razón de la potencia de salida a la de entrada se expresa como

dP1 2cx 2 I,R 1


dP. = kT (
- 1+ n -
l I.) . (13.6-11)

e 1,0

Esta ecuac10n expresa la ganancia de potencia en c-d con señal pequeña del
dispositivo. En un caso típico, se podría esperar que los valores de los diferentes
parámetros fueran más o menos como sigue: le= 10 maleo= 10 /.lfl, a= 0.99,R 1 =
1000 ohms y kT/e =1/40V a 300°K. Si se substituyen estos valores en la ecuación
anterior, se obtiene una ganancia de potencia de aproximadamente 100.
La ganancia de corriente del dispositivo es la relación dlc/dle. De acuerdo con
(13.6-8), es obvio que esta cantidad es sencillamente a y que, en general, de acuerdo
con (13.6-2), la ganancia de corriente puede representarse como

ex- -(ole)
- oJ, Ve
(13.6-12)

'---.-b.---' Contacto
b
óhmico
de base

(o) ( b)

(e) c::=J tipo·n ~tipo-p (d)

Figura 13.16. Etapas sucesiva• de la "transformación topológica" del transistor de filamentos de


Haynes-ShocÍdey mencionado en el capítulo 10 para convertirlo en una estructu·
ra p-n·p planar convencional.

En la figura 13.16(a) se ilustra la estructura de Haynes-Shockley (sin circuito


de barrido, que no se requiere en un transistor en donde se confía sólo en la
difusión para transportar los portadores en exceso del emisor al colector), que se
puede convertir a un transistor convencional de unión p-n-p mediante una "transfor-
mación topológica" que altera las dimensiones y las proporciones de las diferentes partes
del dispositivo, pero dejan inmutables sus relaciones físicas y básicas. Esto se logra tal
como se ilustra en la figura 13.16. Los electrodos de puntas para el contacto del emisor
Transistores de unión p-n-p y n-p-n 467

y el colector se substituyen primeramente usando en su lugar dos regiones pequeñas


tipo p bajo los cables de conexión que ahora se consideran como contactos óhmicos a las
regiones p, como se indica en la figura 13.16(b). Es evidente que esto no afecta el funcio-
namiento del dispositivo, ya que las características de corriente-voltaje de los puntos de
contacto de rectificación y las uniones p-n son fundamentalmente lo mismo. A continua-
ción, se considera que las regiones p se extienden como sucede en (e) para incluir un volu-
men mayor del cristal, llegando por último a la configuración convencional del transistor
de unión p-n-p que aparece en (d). Aunque el aspecto de esta estructura es diferente al
del transistor de filamentos de Haynes-Shockley, funciona más o menos en la misma
forma. La razón por la que se adopta la estructura ilustrada en (d) de la figu-
ra 13.16, es que la fracción de huecos inyectados en el emisor, que sobreviven para
poderse recoger en el colector (y, con el! o, obtener la ganancia de corriente del
dispositivo) debe hacerse tan grande como sea posible.
La ganancia de corriente a puede diferir de la unidad debido a la recombina-
ción de portadores en exceso en la región de base del transistor; también puede
diferir de la unidad porque no toda la corriente de unión del emisor se debe a la
inyección de huecos en la región de base tipo n proveniente del emisor tipo p.
Existe también una componente de la corriente de emisor que se origina por la
inyección de electrones desde la región de la base hacia el emisor, que no produce
ninguna corriente de señal en el colector; pero que fluye a través del conductor de
base. Esto equivale a decir que la eficiencia de inyección de huecos de la unión 11p,
como se vio en la sección 13.1, no llega por completo a la unidad, y que la
eficiencia de inyección de electrones 11n no es cero. Por esta razón, se ve clara-
mente la ventaja de diseñar el transistor p-n-p de tal manera que la eficiencia de in-
yección de huecos de la unión de emisor sea casi la unidad y la eficiencia de inyec-
ción de electrones sea muy reducida. En cualquier caso, la ganancia de corrien-
te a se puede expresar como el producto de la eficiencia de inyección de portadores
minoritarios del emisor por la fracción de los portadores minoritarios que, una vez
que se han inyectado dentro de la región de base del dispositivo, sobreviven para ser
recogidos por el colector 13 por lo cual, si este último factor se representa por
medio de f,

(13.6-13)

La ganancia de corriente de un transistor planar p-n-p, como el que se presenta


en la figura 13.17, se puede calcular con los métodos de análisis que se desarro-
llaron en la sección 13.1 en relación con el rectificador de unión p-n. Las ecuaciones
de continuidad de estado estacionario se puede expresar como sigue

(x <O: región del emisor) (13.6-13)

Pn- Pno_ O
2 - (x >O; región de la base) (13.6-14)
LP

13 Además, existe una posibilidad de que la eficiencia del colector no sea la unidad, por
que parte de la corriente de colector se deberá a la emisión de portadores minoritarios que va
desde la región del colector hacia la región de la base. No obstante, en las condiciones normales
de polarización de colector, este efecto es tan pequeño que puede desecharse, en comparación
con los dos efectos antes vistos. Por tanto, aquí sólo se toma cuenta explÍcita de los dos efectos
mayores.
468 Rectificodores de unión p-n y transistores

Por tanto, esto hace suponer que todas las caídas de voltaje aparecen en las
uniones y, en consecuencia, no existen campos en las regiones volumétricas y, tam-
bién, que las densidades de portadores inyectados son pequeñas en todas partes en
comparación con las cantidades de portadores mayoritarios en equilibrio. También se
supondrá que el efecto de la generación y recombinación de portadores dentro de
las regiones de carga espacial asociadas con las uniones, son despreciables y que la
extensión de tales regiones es pequeña en comparación con el espesor de la región
de base. En estas circunstancias, lo único que se requiere es aplicar condiciones de

Emisor (tipo·P.) Base (tipo-n) Colector (tipo-p)

Unión
del colector

x=O X=d -X

Figura 13.17. Geometría y notación utilizadas en el análisis del transistor planar p-n-p de la
sección 13.6.

frontera y evaluar las corrientes de difusión en x =O y x = d, evitando las compli-


caciones que introducen las cantidades x 0 + y x 0 _ en las ecuaciones de la sec-
ción 13.1. Evidentemente, y realizando sólo un esfuerzo un poco mayor en los
cálculos, cualquier efecto producido por la extensión fmita de las capas de carga
espacial se puede resolver por los métodos usados en las secciones 13.1 y 13.3. En
lo que respecta a condiciones de frontera, será necesario que

(13.6-15)

(es decir, que cualquier densidad de portadores minoritarios en exceso desciende a


cero muy lejos, dentro de la región del emisor), que

Pn(d) =O, (13.6-16)

por lo cual, la densidad de portadores minoritarios excedentes se reduce a cero en el


borde de la unión de colector con polarización inversa (esto se deduce de la aplica-
ción de la condición de frontera (13.1-13) en la unión de colector con un voltaje de
colector grande y negativo) y, además, que en la unión del emisor

n P(O) = n pO eev ,/kT (13.6-17)

(13.6-18)

Las condiciones de frontera en la unión del emisor corresponden totalmente


con las que se estudiaron en el caso del rectificador p-n. Por supuesto, se supone
Transistores de unión p-n-p y n-p-n 469

que la región del emisor se extiende a muchas longitudes de difusión a la izquierda


de la unión de emisor.
La solución general de estas ecuaciones se puede expresar en la forma que
sigue

n p - n p o = AexfLn + Be-xfLn (x <O) (13.6-19)

y
X X
Pn - Pno = C cosh - + D senh- (x > 0). (13.6-20)
LP LP
De acuerdo con (13.6-15), se ve que B =O; en este caso, las condiciones de
frontera para electrones y huecos en la unión del emisor están dadas por

(13.6-21)
y
(13.6-22)

Ahora se puede utilizar la condición de frontera de colector (13.6-16) para


evaluar el único coeficiente restante, y el resultado es

D = - Pno[(eeY,/kT- 1) ctnh .!!._ + csch .!!..], (13.6-23)


LP LP
por lo cual, de acuerdo con (13.6-19) y (13.6-20)

np _ npO = npO(eeV.JkT _ l)ex/Ln (13.6-24)

Pn- Pno = Pno[(eeV,fkT- 1) cosh ~- {<eeV.JkT- 1) ctnh .!!._ + csch .!!...} senh ~]
LP LP LP LP

(13.6-25)

Las corrientes de electrones y huecos que pasan por las uniones de emisor se
evalúan como se hizo en el caso del rectificador p-n, lo cual da

Jn(O) = -Dn(dnp) = - npoDn (eeV.JkT- 1) (13.6-26)


dx o Ln
y
(13.6-27)

La densidad de corriente de huecos que pasa por el colector se determina en


la misma forma y el resultado es
470 Rectificadores de unión p-n y transistores

La eficiencia de inyección de huecos en la unión de emisor es la razón entre


la corriente de huecos y la corriente total que pasa por el emisor. Esto se calcula a
partir de (13.6-26) y (13.6-27). Cuando se hace esto se puede suponer que en la
operación normal del emisor, la corriente real de emisor es mucho mayor que la de
saturación, de tal manera que ee V efkT > l. Los términos de las ecuaciones anteriores
que no contienen el factor exponencial se pueden hacer a un lado y (recordando
que nnoPno = Pponpo = n~ ), se puede demostrar fácilmente que

(13.6-29)

La fracción de huecos inyectados en el emisor, que sobreviven a la recombina·


ción para ser recogidos en el colector, en estado estacionario, es
d d d
ctnh - cosh - - senh-
f = Jp(d) ~ LP LP LP = h.:!._ . (13.6-30)
O) _ d sec
Jp( ctn h - LP
LP
También en este caso se ha hecho caso omiso de los términos de (13.6-27) y
(13.6-28) que no contienen el factor exponencial eeVefkT. Ahora, la ganancia de
corriente a se puede expresar como

(13.6-31)

Este resultado se obtuvo suponiendo que Ve> kT/e; pero se puede demostrar,
usando un método de cálculo más preciso, que (13.6-31) es correcta, ya sea que se
satisfaga o no esta condición. Los detalles de esta proposición están asignados en el
ejercicio 13.6 al final de este capítulo. Es evidente que, para que a sea tan grande
como sea posible, es necesario que la anchura de la región de base tenga un mínimo
posible, y que la longitud de difusión Lp (y, por ende, el tiempo de vida de los
huecos dentro de la región de base tipo n) sea también lo más grande posible;
además, para proporcionar la máxima eficiencia de inyección de huecos, la densidad
de impurificación del emisor Ppo debe ser mucho mayor que la densidad de impu·
reza nno en la región de base del dispositivo. Esta última condición se satisface
automáticamente, cuando los transistores de germanio p-n-p se fabrican por el pro-
ceso de aleación, utilizando trocitos de indio para formar las regiones de emisor
y colector recristalizadas y germanio tipo n para moderar la densidad de impurezas
de la base.
De acuerdo con las suposiciones que se hicieron en estos cálculos, se encuentra
que la ganancia de corriente es independiente de la corriente de emisor. Para valores
muy grandes de ésta, la densidad de portadores en exceso en la región de la base.
cerca del emisor, puede ser igual o sobrepasar a la densidad de portadores mayori-
tarios en equilibrio en ese punto. Cuando esto sucede, ya no se puede utilizar la
forma simple de las condiciones de frontera en la unión, tal como lo indican
(13.1-12) y (13.1-13), y es necesario adoptar la forma más general (que se describe
en la nota al calce 1 de la sección 13.1). Entonces, se puede demostrar que la
eficiencia de inyección de huecos de la unión de emisor desciende por debajo del
valor dado por (13.6-29), existiendo en la unión una corriente mayor de electrones
Transistores de unión p-n-p y n-p-n 4 71

que la que podría esperarse de acuerdo con la teoría de nivel bajo. Esta reducción
en la eficiencia del emisor lleva a una reducción en la ganancia de corriente a
grandes valores de corriente de emisor. La disminución en la eficiencia de emisión se
sugiere de acuerdo con la forma de (13.6-29), en donde se obtiene una reducción en
el valor de T/p para grandes corrientes de emisor, si la relación real (nn(O)/pp(O)) se
usa en lugar de la relación de equilibrio nno/Ppo, siendo la relación verdadera mu-
cho mayor que la relación de equilibrio en condiciones de una gran polarización
directa, debido a que la condición de casi neutralidad requiere que cuando se inyec-
tan grandes concentraciones de huecos en exceso en la región n, deben ir acompaña-
das de concentraciones equivalentes de electrones excedentes.
El análisis anterior se ha concretado a la determinación de la ganancia de
corriente en función de los parámetros del dispositivo en una condición de estado
estacionario y, por ende, para una frecuencia cero. Para señales sinusoidales, se
observa que la ganancia de corriente decrece al aumentar la frecuencia. La razón de
este efecto se basa en la naturaleza del proceso de difusión. Si se aplica una señal
sinusoidal al emisor de un transistor, en la región de base se genera una concentra·
ción de densidad de portadores en exceso que varía de un modo también sinusoidal.
En estas condiciones, los portadores se difunden saliendo de las regiones de alta
concentración para "llenar" las de baja concentración, reduciendo la amplitud de la
señal incluso si el tiempo de vida en la región de la base es infmito, como se ilustra
en la figura 13.18. Cuanto más alta es la frecuencia, tanto más pronunciados son los

P-P0

Frecuencia baja f/,


. ¡A\~ In\~1ru1ru1nl111n\11ru1m\-/ ~!u~~fusión"'
Alta frecuen-CI-a-+r_J_u_u_u_u_u_u_ U_l____ ----1 ' . . - - - - - - - - - - - - - - -

+- -x
Figura 13.18. Perfiles de exceso de portadores dentro de la región de base de un transistor
p-n-p asociados con señales en c-a de alta y baja frecuencia, mostrando los
efectos más drásticos de la difusión para atenuar las señales de alta frecuencia.

gradientes de concentración asociados con las variaciones locales en la densidad de


portadores en exceso, y tanto más pronunciados los efectos de difusión.
La variación de la ganancia de corriente en función de la frecuencia se puede
entender cuantitativamente viendo la ecuación de continuidad dependiente del tiempo

D C2 (P. - P.o) _ Pn - Pno = c(p. - P.o)


(13.6-32)
P cx 2 rp iJt

Si se supone que
p.(x,t)- Pno = u(x)eiwr (13.6-33)
y se substituye esto en (13.6-32), se obtiene la siguiente ecuación diferencial

d2 u 1
-2- -(1
dx L 2p
+ iwr P )u(x) =0 (13.6-34)
472 Rectificadores de unión p-n y transistores

para u(x). La solución general de esta ecuación tiene la forma

u(x) =A exp(:P j1 + ianP) + B exp(- :P j1 + iw-rP)

(p + iy)x -(P + iy)x


= A exp + B exp , (13.6-35)
LP LP

en donde

p= Re(j1 + iw-rp) y y = Im(J 1 + iwtp). (13.6-36)

El problema de calcular la parte real y la imaginaria que se mencionan en


(13.6-36) se soluciona de un modo relativamente directo, y los resultados son

(13.6-37)

(13.6-38)

En las expresiones anteriores se debe escoger el signo más del radical, ya que
en el límite, conforme w tiende a cero, se debe obtener (32 = 1 y '}' 2 =O. Si L~
representa la constante de decaimiento exponencial asociada con la solucion (13.6-25),
entonces, al usar (13.6-37), es evidente que

(13.6-39)

siendo
1 p J
1
-- 2 2
J.: =
P
LP= J- +
2LP
1 ./1 +w 't" P' (13.6-40)

en donde el valor de Lp es precisamente el valor de estado estacionario dado por


(13.1-9). De acuerdo con (13.6-39) y (13.6-40), se ve que, a frecuencias bajas, la
constante de degeneración L~ relacionada con la solución de la ecuación de continui-
dad está dada por

I.:P ~ LP = jDPtP (13.6-41)

que es precisamente el valor de estado estacionario que se obtuvo en (13.6-20), en


tanto que para frecuencias crecientes, L~ disminuye a partir de este valor, acercán-
dose en el límite de altas frecuencias al valor

J.:
P-
~ LPJWtp
2 = J2D
W
P (13.6-42)

En la figura 13.19(a) se ilustra una gráfica de L~ en función de la frecuencia.


De acuerdo con esto, es evidente que en las condiciones de c-a la distancia
efectiva de decaimiento que se debe utilizar para encontrar la fracción de la señal de
entrada que llega al colector es L~ y no Lp. El valor L~(w) tal como lo da
Transistores de unión p-n-p y n-p-n 473

(13.640) debe substituirse en la ecuación (13.6-30), que proporciona el factor de


decaimiento f. El resultado es
d
sech-;--()
~p w
a(w) = 'lp/ = b L d· (13.6-43)
nno p
1 +--tanh-
PpoLn LP

En condiciones normales, a la frecuencia cero, L~(O) será mucho mayor que la


anchura de base d y f = sech (d/L~) será aproximadamente igual a la unidad. Al
aumentar la frecuencia, se llegará a un punto en donde L~ tiene una magnitud

In Lp(w)
a

Lp~------------ ~----------::e'-----~---
.. , 1
Valor
de d·c
1
\1 1
\
a __.j1
Pendiente- 1/2 ~ 1-a 1\
1 '
11 ' ..... _ ......1

-lnw
"'O
(a) (b)

Figura 13.19. (a) Gráfica de L~(W) tal como lo indica (13.6-40) en función de w. (b) Gráfica
de la ganancia de corriente en función de la frecuencia, de acuerdo con los
resultadvs de la sección 13.6, en donde se muestran las frecuencias de corte de
a y de (3, Wo y w~.

comparable con d y en esta región de frecuencia, el valor de f y, por ende, el de a,


es notablemente menor que la unidad, como se indica en la figura 13.19(b). La
ganancia de corriente en esta región comienza a reducirse en comparación con su
valor de frecuencia cero. La "frecuencia de corte a" del dispositivo, w 0 , se puede
definir como sigue

(13.6-44)

Substituyendo este valor de L~ en (13.640) y despejando la frecuencia, se


tiene

2jDPJDPrP-
wo=-d- --;¡r--1. (13.6-45)

Para frecuencias que sobrepasan este valor, la ganancia de corriente es mucho


menor que el que se tiene a la frecuencia cero. Es obvio que para lograr altas
frecuencias de corte, se requieren valores pequefios en la anchura de base y valores
grandes en los tiempos de vida en la región de base.
Antes de concluir con el tema de los transistores, se estudiará brevemente el
circuito de emisor a tierra y el circuito de base abierta de estos dispositivos. En
el circuito que aparece en la figura 13.16 (circuito de base a tierra) se supuso que se
474 Rectificadores de unión p-n y transistores

introdujo un incremento de corriente die al electrodo emisor. Como se ilustra en la


figura 13.20, en el circuito de emisor conectado a tierra se introduce una señal de
corriente dib al cable de base. De acuerdo con la continuidad de la corriente, se
debe tener siempre

(13.6-46)

de donde,

(13.6-47)

Figura 13.20. Circuito de emisor a tierra de un transistor p-n-p.

No obstante, por definición, die =die/a, de donde,

ex
di = - - dib = f3dlb (13.6-48)
e 1 -ex

La cantidad

f3 =die= _ex_ (13.6-49)


dlb 1- ex
es la ganancia de corriente de emisor a tierra del transistor. Evidentemente, esto
demuestra que la configuración del circuito de emisor a tierra se puede emplear para
proporcionar factores de amplificación de corriente mayores que la unidad. La confi-
guración de emisor a tierra es la disposición del circuito que se usa con mayor
frecuencia en amplificadores de transistor y es algo análogo, desde el punto de vista
eléctrico, al amplificador de tubo al vacío con el cátodo conectado a tierra, en
donde el emisor corresponde al cátodo, la base a la rejilla y el colector a la placa
del tubo al vacío. La frecuencia de corte para la conexión de emisor a tierra es
menor que para el mismo transistor en la configuración de base a tierra, ya que si
el valor de a a la frecuencia cero es casi igual a la unidad, como sucede casi siempre,
sólo se requiere una pequeña reducción de a para producir un porcentaje de reduc-
ción mucho mayor en a/(1 -a). Esto se ilustra por medio de la curva punteada de la
figura 13.19(b), en donde la frecuencia de corte de (3, w~, a la que la ganancia del
emisor a tierra se reduce por el mismo factor que la ganancia de base a tierra en la
frecuencia de corte de a, w 0 , es considerablemente menor que la frecuencia de corte
de a.
Otro efecto interesante del funcionamiento del transistor de unión, es la auto-
amplificación de la corriente de saturación del colector en un circuito de base
abierta, tal como se señala en la figura 13.21. En este caso, las corrientes de emisor
Transistores de unión p-n-p y n-p-n 475

y colector deben ser iguales y, por tanto, a condición de que la magnitud del voltaje
de batería sea mucho mayor que kT/e, se debe tener, de acuerdo con {13.6-2),

(13.6-50)

en donde,

1=~
e 1 - OC (13.6-51)

~-~-c-=-4--------------~ ~
Figura 13.21. Autoamplificación de una corriente de colector en un circuito de base abierta.

Por tanto, en este circuito, la corriente de colector se autoamplifica por un


factor de 1/(1 -a). Este efecto proporciona una forma muy sencilla aunque aproxi-
mada para medir la ganancia de corriente en c-d de un transistor de unión. La
corriente de saturación del colector leo se determina primerame~te abriendo el cir-
cuito del emisor y completando el circuito de base, observando la cantidad de
corriente que fluye. A continuación se abre el circuito de base y se cierra el de
emisor, como se indica en la figura 13.21, y se determina la corriente de colector
autoamplificada por esta operación. Entonces, la ganancia de corriente se puede
determinar a partir de (13.6-51). Esta autoamplificación de la corriente de saturación
proporciona también la base para comprender el funcionamiento de los dispositivos
de coiUI1utación de cuatro capas p-n-p-n que se verán detalladamente en un capítulo
posterior.
Aunque los estudios de esta sección se han limitado exclusivamente a los
transistores de unión p-n-p, es obvio que se puede realizar un análisis idéntico para
las unidades n-p-n, llegando a ecuaciones que son iguales a las que se derivaron
antes, con la excepción de que los subíndices n y p deben intercambiarse y la
cantidad b se substituye por 1/b. Sin embargo, debe hacerse notar que los voltajes
de polarización que deben usarse en conexión con las unidades n-p-n, tienen el signo
inverso con respecto a los correspondientes a los transistores p-n-p.

EJERCICIOS

l. Analice la forma restrictiva de la característica corriente-voltaje de un rectificador ideal


de unión p-n, como el que se vio en la sección 13.1, conforme la temperatura tiende a cero.
¿Qué es lo que determina la máxima temperatura de funcionamiento práctico para el disposi-
tivo?
2. Demuestre que la aplicación de las condiciones exactas de frontera (12.3-1) y (12.3-2) a
las soluciones (13.1-14) y (13.1-15) para el rectificador de unión p-n de la sección 13.1 en
donde la variación de la concentración de portadores mayoritarios, debida a la presencia de Ja
476 Rectificadores de unión p-n y transistores

distribución de portadores en exceso no se desprecia, lleva a una característica corriente-voltaje


de la forma

Se puede suponer que la razón de movilidades b es muy cercana a la unidad y que los
perfiles de concentración (13.1-14) y (13.1-15) no se ven gravemente afectados por los fenó-
menos de transporte ambipolar. Observe que esta ecuación predice que J ~oo conforme V0 ~%­
lo cual significa que la barrera de potencial interno de unión nunca se "allana" por completo, ni
en corrientes muy grandes. Evidentemente, la expresión se reduce a los resultados previos para
voltajes inversos y directos que son pequeños en comparación con (/>o.
Desde el punto de vista experimental y en condiciones de alta corriente, en lugar de
comportarse como se predice, la desviación de la curva corriente-voltaje de la forma ideal tal
como la da (13.1-23), está en dirección opuesta, como lo indica el diagrama adjunto. La razón
se basa no tanto en el hecho de que la expresión anterior no representa correctamente la
relación existente entre la caída del voltaje de unión y la corriente, sino más bien en que (a) a
altas corrientes, se producen grandes caídas Óhmicas de voltaje adicionales en las regiones volu-
métricas a ambos lados de la unión y (b) en condiciones de corriente elevada, una estructura de
rectificador por aleación de tamaño finito puede actuar como una estructura de tres regiones
p-(intrínseca)-n, en donde todos los portadores inyectados a la región n cuya impurificación es
moderada están obligados a permanecer ahí hasta que se recombinan. Esta región se inunda con
pares electrón-hueco, la concentración de estos pares aumenta a un valor que sobrepasa enor-
memente a la concentración normal de portadores mayoritarios de equilibrio, por lo cual, la
región se comporta de un modo muy semejante a un capa intrínseca semiconductora. El con-
tacto metálico del lado opuesto de esta capa, que casi siempre se hace con una soldadura que
contiene una concentración bastante grande de impurezas donadoras, forma una capa tipo n

1
Ecuación (13.1-23)

1
1

1
¡
L- Experimental
(~e•Vo/ ur¡
Teórica
1

delgada, recristalizada y con fuerte impurificación, que termina al otro lado del disposibvo. Una
investigación de las características de un dispositivo de esta Índole (como el que se presenta en
el siguente capítulo) da como resultado una relación corriente-voltaje que concuerda muy bien
con los que se obtuvieron en rectificadores reales de este tipo en las mismas condiciones.
3. A 600°C, el contenido de germanio en fase líquida indio-germanio en equilibrio con
germanio SÓlido, es aproximadamente un 20 por ciento atómico, como se determina mediante el
diagrama de fase binaria de In-Ge. Si se utiliza el valor K de equilibrio que se indica en la
tabla 11.1, calcule la concentración de receptores en la capa p recristalizada de un rectificador
de aleación p-n fabricado fusionando un trozo de indio sobre germanio tipo n, aumentando la
temperatura a 600°C y enfriando gradualmente. Efectúe el mismo cálculo para un rectificador
Transistores de unión p-n-p y n-p-n 477

hecho en la misma forma, utilizando una aleación de indio que contiene S por ciento de galio
atómico. ¿Qué aleación se preferirá para formar el emisor de un transistor de unión p-n-p?
4. Suponga que se superpone un pequeño voltaje en c-a V1 eiwr al voltaje uniforme en
c-d Vo que se aplica al rectificador p-n de la sección 13.1. Suponiendo que V 1 ~kT/e, encuentre
una solución de la ecuación de continuidad dependiente del tiempo para huecos en la región n que se
reduzca al valor correcto de c-d para W= O y que tienda a cero en ellúnite en donde x ~oo. Para
mayor facilidad, deberá despreciarse el espesor de la región de carga espacial de la unión en com·
paración con la longitud de difusión.
S. Use la solución obtenida en el problema 4 para encontrar la característica corriente-vol-
taje en c-a de la unión p-n de la sección 13.1. Demuestre que la impedancia en c-a del dis-
positivo es similar a la de una resistencia y un capacitor conectados en paralelo. Encuentre
expresiones para la capacitancia equivalente en los límites de baja y alta frecuencia, y observe
que, aunque la capacitancia equivalente es casi siempre una función de la frecuencia, en el límite
de baja frecuencia se hace independiente de ésta, al igual que un condensador ordinario. La
capacitancia obtenida de esta manera se asocia con el almacenamiento y la difusión de porta-
dores de carga en exceso en las regiones volumétricas p y n del dispositivo, y es muy distinta de
la capacitancia de carga espacial que se vio en la sección 12.S. Esta componente de la capac!tan-
cia del dispositivo se conoce a veces como capacitancia de inyección o capacitancia de difusión.
6. Utilice las expresiones exactas (13.6-26), (13.6-27) y (13.6-28) para escribir las corrien-
tes de emisor y colector y, calculando directamente a partir de la definición (13.6-12) la can-
tidad

die die dV,


oc=-=- -
di, dV,. di,

demuestre que la expresión (13.6-31) para a se obtiene independientemente de cualquier suposi-


ción en lo que respecta a la magnitud del voltaje de emisor. El método adoptado en el texto se
utiliza debido a que presenta con mayor claridad los papeles independientes de la eficiencia de
inyección y el factor transporte.

LECTURAS RECOMENDADAS

J. K. Jonscher, Principies of Semiconductor Device Operation, G. Bell and Sons, Ltd., Londres
(1960).
Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N. J.
(1964), capítulo 4.
W. Shockley, "The Theory of p-n Junction Semiconductors and Junction Transistor," en Bel/
System Technical Journal 28, 43S-489 (1949).
A. van der Ziel, Salid State Physical E/ectronics, Prentice-Hall, Inc., Englewood Cliffs, N. J.
(19S7), capítulos 13 y 14.
Proc. lnst. Radio Engrs., "Transistor Issues," 30 (diciembre 19S2) y 46 Uunio 19S8).
Uniones p-n a niveles altos de
corriente; El rectificador p-i-n

14.1 UNIONES p-n A DENSIDADES ALTAS DE CORRIENTE

En la seccwn 13-1, se presentó el análisis del rectificador de unión p-n, res-


tringiéndose la validez del mismo a la región de polarización inversa y a los valores
de voltaje de polarización directa que son pequeños, en comparación con la barrera de
potencial interno en equilibrio 1/>0 • Esta restricción tiene varias razones, las más impor-
tantes son las que siguen:
(i) En la región de polarización directa, a altos niveles de corriente, las condi-
ciones simples de frontera (13.1-12) y (13.1-13) ya no son válidas, porque la con-
centración de los portadores minoritarios inyectados en las regiones volumétricas p y
n, cercanas a la unión, pueden ser comparables a la densidad de portadores mayo-
ritarios en equilibrio en este punto. En tales circunstancias, la distribución de porta-
dores mayoritarios que acompaña a los portadores minoritarios para asegurar la casi
neutralidad, es tan densa que perturba gravemente la concentración de portadores
mayoritarios, cerca de la unión de su valor de equilibrio. Por tanto, las condiciones
exactas de frontera (12.3-1) y (12.3-2) deben usarse en lugar de las aproximadas
(13.1-12) y (13.1-13),
(ü) A altos niveles de corriente directa, la densidad de portadores minoritarios
inyectada cerca de la unión puede ser tan grande, que el total de las densidades de
portadores mayoritarios y minoritarios en esa región tengan una magnitud compa-
rable. Los coeficientes de transporte ambipolar D* y f.l*, tal como los da (10.2-34)
y (10.2-35), en este caso se deben utilizar en la ecuación de continuidad, en lugar
del coeficiente de difusión de los portadores minoritarios y la movilidad, que se
aplican sólo a densidades bajas de portadores en exceso. Si la razón de movilidad b
es grande, en comparación a la unidad (como puede suceder en algunos de los
semiconductores intermetálicos III-V), este efecto puede tener una gran importancia,
en tanto que si b es relativamente pequeño (como lo es en el silicio y el germanio),
no se encontrará un cambio muy grande en las características del dispositivo.
(iü) A niveles altos de corrientes no se pueden omitir los campos eléctricos
originados de los gradientes de concentración y de la caída óhmica de voltajt', en las
regiones volumétricas p y n.
Se puede hacer una corrección de la característica corriente-voltaje del rectifi-
cador p-n de la sección 13.1, tomando en cuenta sólo el efecto que se vio antes
en (i). El resultado se dio y analizó en relación con el ejercicio 13.2; el lector
puede consultar esta exposición para ver los detalles de la situación. La conclusión
es que, en general, los efectos de (ü) y (iü) anteriores, junto con otros fenómenos

479
480 Uniones p-n a niveles altos de co"iente; el rectificador p-i-n

Terminal
de Cobre
Región n+ delgada
recristalizada
·~--~~--~~~~--.
Ge

Soldadura que contiene


impurezas donoooras (Sn +Sb)

Figura 14.1. Diagrama de corte transversal de un rectificador de aleación, en el que se muestra


la estructura p+-n-n+.

que se describirán en breve, tienen tal importancia, que el resultado obtenido en esa
forma difícilmente puede aplicarse por sí solo, para explicar la relación corriente-
voltaje de dispositivos reales, en la región de polarización directa.
Además de estos tres efectos, las características de nivel de corriente elevada
de muchos rectificadores reales p-n (sobre todo los que se fabrican mediante
procesos de aleación), difieren de las que se esperan, basándose en la teoría de la
unión p-n de corriente baja, debido a que en la región de altos niveles de corrien-
te, esos dispositivos actúan como estructuras que tienen tres regiones distintas, una
tipo p, intrínseca, y tipo n, separadas por dos uniones (p-intrínseca e intrínseca-n).
Por lo común, esta estructura se conoce como rectificador p-i-n. La razón de este
estado de cosas se puede entender, consultando la figura 14.1, que en un corte
transversal muestra la construcción de un rectificador de unión p-n de aleación. Se ha
formado una región p sumamente impurificada, mediante la aleación de un trozo de
indio sobre una oblea de germanio tipo n, con un contenido moderado de impurezas
donadoras, 1 casi siempre del orden de 10 15 donadores por cm 3 • Con frecuencia la
región fuertemente impurificada se identificaba como región p+. Aquí, se adoptará
esta notación y se usará en forma sistemática. Durante el mismo ciclo de calenta-
miento, en el que se forma la unión p+ -n, se acostumbra soldar la oblea de
germanio a una base de níquel con una soldadura de estaño, que lleva impurezas
donadoras tales como el antimonio. El objetivo es establecer un contacto "óhmico"
entre el germanio y el níquel. Evidentemente, una soldadura que contenga impurezas
receptoras tenderá a disolver parte del germanio y a depositar una capa recristali-
zada p+, cuando se enfría, para formar la segunda unión n-p+, cuya naturaleza sería
indeseablemente, no óhmica. Por tanto, se acostumbra utilizar una soldadura que
contenga una pequeiia concentración de impurezas donadoras. En este caso, se forma
una capa recristalizada de n+, en la misma forma, entre el germanio y la soldadura,
y se tiene una unión n-n+ en la interfaz entre esta capa y el cristal original. La
estructura resultante es un dispositivo p+-n-n+; pero, a densidades de corriente baja,
tales como las que se encuentran en la condición de polarización inversa o una
pequeiia polarización directa, la unión n-n+ actúa en forma algo semejante a una
unión p-n que tiene una corriente de saturación extremadamente grande y, por
tanto, características de rectificación muy deficientes (vea la ecuación (13.1-24)),

1 Mayores concentraciones de donadores darían como resultado valores e_xcesivos del carn·
po eléctrico dentro de la región de carga espacial y, por tanto, menores voltajes de ruptura de
avalancha. (Véase la tabla 12.1.)
El análisis del rectificador p+·i-n+ a niveles altos de corriente 481

aproximándose así al comportamiento de un contacto óhmico. Sin embargo, a va-


lores más elevados de voltaje de polarización directa, la unión p+-n inyecta un gran
número de huecos en exceso y si la concentración de éstos es de mayor o del mismo
orden de magnitud que la densidad de electrones en equilibrio dentro de la re-
gión central n moderadamente impurificada, entonces las concentraciones totales de
electrones y huecos en dicha región son comparables2 y la región se comportará en
forma muy semejante a un cristal semiconductor intrínseco. La representación de
altos niveles de corriente del dispositivo, se justifica entonces plenamente como una
capa intrínseca limitada a la izquierda por una unión intrínseca p+ y, a la derecha
por una unión intrínseca n+, es decir como un rectificador p+-t-n+. El análisis de
un dispositivo de este tipo ilustra las técnicas generales que deben emplearse para
todos los dispositivos a altos niveles de corriente.

14.2 EL ANALISIS DEL RECTIFICADOR p+.;.n+


A NNELES ALTOS DE CORRIENTE

En esta secc10n, se examinarán las propiedades en la región de altos niveles de


corriente, de un dispositivo unidimensional p+-J-n+, como el que se ilustra en la
figura 14.2. En este dispositivo, se supone que las concentraciones en equilibrio de
portadores mayoritarios Ppo y nno en las regiones p+ y n+, son mucho mayores
que la concentración en equilibrio de portadores mayoritarios n 0 en la región central
con una impurificación moderada. Se puede hacer caso omiso de la penetración
fmita de las regiones de carga espacial de la unión hacia la capa central (en las
condiciones de polarización directa) en comparación con el espesor total 2d de esta
capa; la recombinación de los electrones y los huecos en exceso dentro de las
regiones de carga espacial, puede también desecharse. No obstante, se supone que la
casi neutralidad eléctrica asociada con la difusión ambipolar de portadores exceden-
tes, se mantiene en todas partes fuera de las capas de carga espacial de la unión.
También se supondrá que toda la corriente que cruza la unión en x = - d,
es una corriente de huecos y que toda la corriente que cruza la unión en x = + d es
una corriente electrónica. Esto equivale a suponer que la eficiencia de inyección
de huecos de la unión p+.¡ y la eficiencia de inyección de electrones de la unión

Concentraciones equilibrad~
de portad ores: Ppo, nP• n,o, Pno

Región-p+. Casi intrrnseco Región-n+


1
x=-d x=O X= d x-

Figura 14.2. Geometría y notaciones del rectificador planar p-i-n, que se vio en la sección 14.2.

2. Se verá que esto es cierto, a pesar de que la concentración de huecos excendentes va


acompañada de una concentración idéntica de electrones en exceso para satisfacer los requisistos
de la casi neutralidad.
482 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

i-n+ equivalen a la unidad. La eficiencia de inyección de huecos [tal como lo muestra


(13.1-28) en el caso de niveles bajos], depende de la razón de la concentración
de electrones en la región n a la de huecos en la región p. Si esta razón es pequeña,
la eficiencia será prácticamente igual a la unidad; si no es así, será mucho menor.
En lo que respecta a la unión p+-i, esta relación es pequeña a una corriente cero y seguirá
siéndolo hasta que la concentración de portadores excedentes de la región central sea
comparable con la concentración de huecos en equilibrio, dentro de la región p+. Esta su-
posición, aunque se justifica todavía para las densidades inyectadas de portadores en ex-
ceso en la región central, que son muy superiores a la densidad normal de equilibrio de los
portadores mayoritarios n 0 en esa región, tendrá una ruptura cuando esta densidad en ex-
ceso se acerque a Ppo. Entonces, aunque este análisis se extiende muy adentro en la region
de altos niveles de corriente, tendrá una validez dudosa, más allá de cierto punto. Se
pueden formular argumentos similares concernientes a la eficiencia de inyección de
electrones en la unión n-n+, llegando a la conclusión de que el considerar eficien-
cias de inyección unitarias es correcto, siempre y cuando Ppo y nno sean grandes,
en comparación con la mayor de las tres cantidades (p 0 , n0 , f>p ), en donde f>p es la
densidad de portadores en exceso en la región central. Esta suposición equivale
también a la proposición de que todos los huecos inyectados en el lado izquierdo de
la unión de la figura 14.2 se recombinan dentro de la región - d < x < + d, en lugar de
hacerlo en la región n+ a la derecha, siendo lo mismo en el caso de los electrones
que se inyectan en la unión del lado derecho. Aunque es cierto que los electro-
nes y los huecos inyectados están obligados a permanecer dentro de la región cen-
tral, debido a las barreras de potencial electrostático en las uniones, como se ilustra
en la figura 14.3, es evidente que, para voltajes de polarización directa lo suficiente-
mente altos, los portadores en exceso pueden derramarse hacia las regiones extremas,
antes de recombinarse. No obstante, para muchas estructuras de estos dispositivos,
puede esperarse que esta suposición se aplique lo bastante bien a valores de corriente
que quedan más allá de los límites de la teoría de nivel bajo. Para las condiciones
en que no se aplica la proposición, las condiciones físicas se hacen muy complejas,
ya que incluye regiones de nivel alto y bajo, que no están bien defmidas, e intro-
duce en el problema condiciones de frontera sumamente complejas.
En las condiciones supuestas, la ecuación de continuidad ambipolar de estado
estacionario (10.2-26) que describe la densidad de portadores en exceso f>p(x) =
f>n(x) dentro de la región central, y que se supone se comporta esencialmente como
un semiconductor intrínseco a los niveles de corriente comprendidos, es

.. ------....
(Un voltaje de polarización directa reduce la - ---- ---
., ___ - ----------------------------
•• ++++++ + ++ ++
+ + + ++ +
altura de las dos barreras) --

+ + r
+ +
+
+ +
+
+ + + +
+ + + +
+ +
Regi6n-p+ Tipo-n impurificado moderadamente Regi6n-n+

Figura 14.3. Diagrama de potencial del rectificador p-i-n.


El análisis del rectificador p+-i-n+ a niveles altos de corriente 483

(14.2-1)

en donde

2 * 2b
L-=D-r=--Dr. (14.2-2)
1 1 b+1 p

En este caso, L¡ es la longitud de difusión ambipolar, D[ es la constante de


difusjón ambipolar intrínseca y como la da (1 0.2-36), 7 es el tiempo de vida de los
portadores en exceso y b la razón de movilidad es P.n/Jlp = Dn/Dp. Puesto que la
movilidad ambipolar p.* es cero en la condición intrínseca, no es necesario conservar
el término del campo en (10.2-26). Si 7 es independiente de 8p y x, como se
supondrá que es el caso, la solución general de (14 .2-1) se puede escribir en la forma

X X
{Jp = p- Po = n - n 0 = A senh- + B cosh L·. (14.2-3)
L; 1

Las ecuaciones que describen el flujo de la corriente eléctrica en la región


intrínseca, como la suma de las corrientes de difusión y arrastre, de acuerdo con
(10.2-8) y (10.2-9),
dp
I P =pe"r-pE- eD P -dx (14.2-4)

(14.2-5)

en donde E es la intensidad del campo eléctrico. Como condición de frontera, se ha


supuesto que

(14.2-6)

Si se hace Ip =O y x = d en (14.2-4), observando en (14.2-3) que dpjdx =


dnjdx, resolviendo para E e insertando el valor obtenido así en (14.2-5), se puede
demostrar que

(a x =d). (14.2-7)

De la misma manera, haciendo que In =O y x = - d en (14.2-5), al resolver


para E y el valor resultante en (14.2-4), se encuentra que

~ = / p(- d) = _ D d p ( 1 + E.) (a x = -d). (14.2-8)


e e P dx n

Por supuesto, el total de densidad de corriente I debe ser el mismo en todos


los puntos, como es el caso del rectificador p- n de la sección 13.1, como se
explicó en relación con las ecuaciones (13.2-3) y (13.2-4). En la región central, n se
da como la suma de la densidad de equilibrio n 0 y la densidad de electrones en
exceso 8P. De igual manera, p es igual a Po + 8P; pero se está investigando el dis-
484 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

positivo en condiciones de corriente y polarización directa tales que lip sea mucho
mayor que n 0 o p 0 • En esas condiciones, pfn:::!. nfp:::!. 1 y (14.2-7) y (14.2-8) se
convierten en

(14.2-9)

Ahora, si se escribe dp/dx como función de x a partir de (14.2-3), al substituir


las condiciones de frontera, (14.2-9) para x = d y x =- d, y resolviendo para las
constantes A y B, se puede obtener

A= _ IL1(b - 1)
y
B = IL1(b + 1) (14.2-10)
d d'
4ebD, cos L. 4ebD, sen-
L;
'
por lo cual, (14.2-3) se puede expresar como

IL1
senh-
L· X
cosh-
L. X]
[
~p(x) = - - (b + 1) - - ' - (b - 1) - - ·
4ebD, cosh -d se nh -d
L1 L1

JL. [ X d
--.....;'-2-d (b + 1) cosh L· cosh L.
2ebD,senh- ' '
L;

X
- (b- 1)senh -senh- . d] (14.2-11)
L1 L1

En la region central, cerca de los bordes de la umon, las concentraciones de


portadores en exceso inyectados, se pueden relacionar con las concentraciones corres-
pondientes de equilibrio de los portadores mayoritarios en las regiones p+ y n+
(suponiendo que 6p es ahora mucho más pequeño que cualquiera de las concentra-
ciones de portadores mayoritarios nno y Ppo en la parte exterior de las regiones con
muchas impurezas), mediante las condiciones de frontera de la forma (13.1-12) y
(13.1-13), para dar 3

p( -d) ~ ~p( -d) = Poe"v,¡kT (14.2-12)

(14.2-13)

3 El uso de las condiciones de frontera de la forma (13.1-12) y (13.1-13) en lugar de las


formas más generales (12.3-1) y (12.3-2), en las que se toman en cuenta los efectos debidos a
las densidades de portadores mayoritarios en las regiones exteriores fuertemente impurificadas,
debido a la presencia de portadores inyectados a estas regiones por las uniones, equivale a hacer
caso omiso de los efectos que se vieron en la sección 14.1, en el punto (i) y en el ejerci-
cio 13.2. Sin embargo, si las regiones n + y p + están muy impurificadas, no hay muchos errores
hasta que se llega a niveles de corriente muy elevados.
El análisis del rectificador p+-i-n+ a niveles altos de corriente 485

en donde V 1 y V 2 son los voltajes aplicados que aparecen en las uniones izquierda
y derecha, en la figura 14.3, respectivamente. Al substituir estos valores en (14.2-11)
y al simplificar, se puede ver claramente que

IL1(1 + b cosh 2d)


~p( -d) = Poeev.¡kT = L; (14.2-14)
2d
2ebDPsenh-
L;

IL1( b + cosh ~)
~p(d) = noeeY /kT =1 • (14.2-15)
2d
2ebDPsenh-

Si se multiplican entre sí las ecuaciones (14.2-14) y (14.2-15), al resolver para
I y recordando que n0 p 0 = nl , se encuentra que

(14.2-16)

1000.--------------,

'O 10 T = 296"K
..S A • 1 50 x I0-2cm 2
0 A/0 • O 013mo
..!?
+ 0
Espesor de la base= 0026 cm
.... o

0.01 L--L----''----'----'---1.----L-~
o 0.1 o 2 0.3 0.4 0.5 0.6
Voltaje

Figura 14.4. Relación de corriente y voltaje de un rectificador de aleación real, ilustrando las
regiones separadas de pendientes e/kT y e/2kT, correspondientes a las regiones de
nivel de corriente baja y de corriente alta. (Figura por cortesía del Dr. H. F.
John, Westinghouse Research Laboratories.)
486 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

Se observará que la corriente en sentido directo se relaciona con la caída total


de vo!taje V¡+ v2 a través de las uniones, mediante el factor ee(V¡ +v2)f2kT y
no con el factor (eeVofkT- 1) que se presenta en la teoría de nivel bajo de la
sección 13.1. El planteamiento de corriente baja de la sección 13.1 predice, por
tanto, que una gráfica de 1n(/ + / 0 ) en función del voltaje, debe ser una recta cuya
pendiente es efkT, en tanto que la teoría p-i-n predice una recta con una pendiente
ej2kT. En la figura 14.4 se muestra una gráfica experimental de la curva corrien-
te-voltaje real de un rectificador p-n de aleación de germanio, dentro de la región
de polarización directa. En este diagrama se puede distinguir una región lineal de
pendiente ejkT a voltajes inferiores a aproximadamente 0.1 V, en donde se puede
esperar que la teoría de nivel bajo será muy apropiada, y otra región lineal con una
pendiente e/2kT a voltajes más altos (0.2-0.45 V), en donde puede esperarse que se
apliquen las condiciones de la teoría p-i-n.
Además del voltaje de las uniones, existe una caída de voltaje adicional que
aparece en la región central y que se origina de los efectos óhmicos y los gradientes
de concentración de la capa casi intrínseca. Esta caída de voltaje se puede deter-
minar, calculando el campo dentro de la región central e integrando sobre esa por-
ción de la estructura. El campo se puede determinar, sumando las dos ecuaciones de
corriente (14.2-4) y (14.2-5), para obtener una ecuación de la corriente total,
resolviendo para el campo y utilizando las relaciones de Einstein (10.2-11), para
obtener

1
E(x)=-- [-I - kT dp]
- (b-1)-. (14.2-17)
nb + p eJLp e dx

En las condiciones que prevalecen en la región central, p ~ n ~ op y (14.2-17)


se convierten en

d</J 1 _ kT b- 1 . ..!__ d(~p)


E(x) = - - = ---:-- (14.2-18)
dx eJLp(b + 1)~p e b + 1 ~p dx

Este resultado concuerda evidentemente con (10.2-39). Al integrar desde - d


hasta d para encontrar la caída de voltaje interno V¡, se puede escribir

</J(d)- </J( -d) = - v¡ = I-ddE(x) dx = eJLp(b-1+ 1) Id-d -~p(x)


dx kT b- 1 Id
+- --
e b + 1 -d
d(ln ~p)

(14.2-19)

o bien,

V.= 1 Id ~-kTb-1ln~p(+d)_ (14.2-20)


' eJLp(b + 1) -d ~p(x) e b+1 ~p( -d)

Al substituir el valor de op(x) a partir de (14.2-11), el valorop(+d)/op(-d)


de (14.2-14) y (14.2-15), integrando y haciendo las operaciones algebraicas tediosas,
para simplificar la expresión resultante, se tiene que
El análisis del rectificador p+-i-n+ a niveles altos de corriente 487

4b kT L;
V¡= -1-+-b-e . _ _....:..___
1[
senh -2d tan- senh-d
L;
J
b+1
(b- 1) 2
1 - - - tanh -d]
L;
J=:==,;,~=,;,..,-=2=d..:..__ _~
2
l + b 2 + 2b cosh -
L;

_ kT b _ 1 In ( b + cosh ~). (14.2-21)


eb+l b h2d
1 + cos -
L;

De acuerdo con esta expresión, la caída interna de voltaje V¡ es independiente


de la corriente. Físicamente, se obtiene este resultado porque, aunque un incremento
de 1 tiende a aumentar óhmicamente a V¡, tiende también a incrementar a op, lo
cual produce una reducción de V¡; estos dos efectos opuestos se anulan, dejando a
V¡ independiente de /. El voltaje total V0 aplicado al dispositivo (haciendo caso
omiso de las caídas de voltaje en los contactos o en las capas p + y n +, con
muchas impurezas), se reduce a la suma de los tres voltajes que se dieron antes:

(14.2-22)

Al sumar las expresiones de los tres voltajes, que se obtuvieron en (14.2·16) y


(14.2-21) y simplificando [sin olvidar que D! = 2bDp(I + b)], se obtiene

V0 2kT
=- IL1
- [ In--*+ lf)b(d/L;) ] (14.2-23)
e en 1D1

en donde

_ [J (1 + b cosh+ l)senh
lf)h(~) -In
2~)( b + cosh 2~)]
(b 2~

(14.2-24)

Por tanto, la caída de voltaje directo en el dispositivo se da como la suma de


un término logarítmico en la corriente y un término independiente de ésta. La pen-
diente de una gráfica de In I en función de V0 , es claramente e/2kT. Se debe ob-
servar que, en vista de las suposiciones iniciales y las aproximaciones que se han
hecho, esta expresión se aplica sólo a la región de altos niveles de corriente directa
y ya no será correcta como 1---* O. El hecho de que (14.2-23) dé un voltaje diferente
a cero para 1 = O, se puede explicar mediante esta observación. El uso de la teoría
de altos niveles de corriente requiere que op sea grande, en comparación con la
densidad de equilibrio de los portadores mayoritarios n 0 de la región central. Se
puede demostrar que esto equivale al requisito de que
488 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

e(b
I
+ 1)
J- •
Di ~ no.
(14.2-25)

Los detalles de esta proposición se asignan como ejercicio para el lector. En el


caso del silicio, en donde b - 4 y D( = 16, esto conduce al requisito de que
(3.1 + 10 14 ) I.Ji sea grande en comparación con n 0 , I grande se expresa ,en amp/
cm 2 , T en microsegundos y n 0 en cm- 3 •
En la figura 14.5 se muestra la gráfica de la función IPb para b = 1 y b = 4.
Se observará que <l>b(~) va al infinito, conforme el argumento tiende ya sea a cero o
a infinito, y tiene un mínimo para un valor del argumento que depende en parte de
b; pero es igual a, aproximadamente 0.7 para b = 4. Sin embargo, el valor mínimo
de V0 a una corriente constante dada, no se produce al valor mínimo de <l>b,
debido a la presencia del término logarítmico de (14.2-23). En efecto, se puede
demostrar que, para una estructura en la que la anchura d es constante, la caída
mínima de voltaje Ve para una densidad de corriente dada, se produce a un valor de L;
determinado por la condición

(14.2-26)

en donde
~ = d/L¡. (14.2-27)

La prueba de este enunciado queda como ejercicio para el lector. En la práctica,


es muy difícil obtener analíticamente el valor de L; para una caída mínima de voltaje di·
recto y, por tanto, la evaluación de esta cantidad puede hacerse de modo gráfico o numé-
rico. Cuando V0 se grafica en función de L;, de acuerdo con (14.2-23) y (14.2-24),
suponiendo que d es constante, se obtienen curvas como las que se ilustran en la
figura 14.6.

3.5 carda óhmica de voltaje


en rectificad ores p-i-n 1
---b = 1 1
3.0
b=4 1
1
25 1
1
1
2.0 1
<Z>b 1
1
1.5 1
1
1
1.0 1
1
1
1
05 /
.... "'
10 15
d
T
Figura 14.5. La función <l>b(d/L), dada por (14.2-24), para b = 1 (curva punteada) y b= 4
(curva continua).
El análisis del rectificador p+-i-n+ a niveles altos de co"iente 489

\ ~
Caída en sentido directo de un
rectificador p-i·n 100 Amps/cm 2
--300"K (27"C) __
1.5 1--
----400" K (127" C)

-.orn•\
..
o
1.0
···=\
~
r\
~
1\..
~.... ....
-- ---
---::::::::::-: - -
~
~ d=00025cm -- - -- ---
d• 001 cm

05

o
0001 001 01
L,cm-

Figura 14.6. Caída de voltaje directa de un rectificador p-i·n, graficada en función de la


longitud de difusión de la región central, L, para varios espesores de la región
central.

En la mayoría de los rectificadores de unión p-n, la máxima disipación de po-


tencia y la generación de calor interno se producen cuando el dispositivo conduce
grandes corrientes en sentido directo.
Esto se puede demostrar fácilmente, comparando el producto IV0 para un
dispositivo típico como el que se investigó en la figura 14.4 en la región de polari-
zación inversa a V0 = - 500 V y en la región de polarización directa, a una densi-
dad de corriente de 50 amp/cm 2 (véase el ejercicio 7, al final del capítulo). Por
tanto, la máxima corriente de carga que puede portarse sin producir una generación
de calor interno destructiva, depende críticamente de la caída de voltaje en el
dispositivo a valores elevados de corriente directa. Las curvas de la figura 14.6, que
se calcularon para rectificadores de silicio p-i-n, ilustran claramente que la mí-
nima caída de voltaje directo se obtiene a un valor óptimo de d/L¡ que, para el
rango de condiciones ilustradas en este diagrama, es casi exactamente la unidad. Si el
tiempo de vida de los portadores en exceso, dentro de la región central del
dispositivo es tan baja que L¡ es mucho menor que d o tan alto que L¡ exceda
substancialmente a d, se producirá una caída de voltaje directa excesivamente alta.
Desde el punto de vista físico, este estado de cosas se origina debido a que la caída
de voltaje de la unión, V 1 + V2 (para una corriente de carga constante dada) se
hace demasiado grande cuando L¡ es mucho mayor4 que d, de acuerdo con
(14.2-16), en tanto que la caída interna V¡ a través de la región central, se hace
muy grande cuando L¡ es mucho menor que d, como lo indica {14.2-21). En conse-
cuencia, se observará un voltaje total mínimo en algunos valores de d, 'IUe no son ni

4 Este comportamiento se predice también mediante la teoría de unión p-n a nivel bajo de
la sección 13.1; esto está claramente ilustrado por la ecuación (13.1-23), en .la que, para una
densidad de corriente dada, el voltaje de unión requerido se hace evidentemente grande cuando
se permite que tanto Ln como Lp se acerquen al irümito.
490 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

mucho mayores ni mucho menores que L¡. Este resultado ilustra la importancia de
mantener en este tipo de estructuras, cuando menos un control aproximado del
tiempo de vida de los portadores en exceso. No obstante, se debe observar que el valor
de 7 que se necesita en las ecuacione3 de esta sección, no es necesariamente el que
se puede obtener en una medición del decaimiento fotoconductivo transitorio que
implica sólo una pequeña concentración de portadores en exceso, sino el valor efec-
tivo que prevalece en las condiciones supuestas, dentro de la región central del
dispositivo, donde están presentes concentraciones muy grandes de portadores en
exceso. Los dos valores pueden ser muy diferentes, en vista de la dependencia de 7 en
relación con la concentración, predicha por (10.8-24) y (10.8-25).

14.3 RECTIFICADORES p-i-n; LA CAlDA DE VOLTAJE EN SENTIDO DIRECTO


COMO UNA FUNCION DE LA TEMPERATURA

En la figura 14.6, la curva punteada representa la caída de voltaje directo, a


una temperatura de 400°K (127°C) para la unidad representada por la curva continua
para d = 0.01 cm, que se ha graficado a una temperatura de 300°K (27°C). Se
observa que para algunos valores de L¡, la caída de voltaje directo disminuye en este
rango de temperatura, en tanto que para otros valores de L¡ (menos de aproximada-
mente 0.004 cm para este caso) aumenta. Esta situación, algo extraña, se debe a
que el voltaje interno V¡ tiene una dependencia en función de la temperatura, que
difiere de la de los voltajes de unión. Para un rectificador "ideal" de unión p-n,
como el que se dio en la sección 13.1, se podría esperar, de acuerdo con (13.1-23)
que

kT ( 1 +-
V0 =-In
e
1)
/0
(14.3-1)

en donde / 0 es la corriente de saturación. Sin embargo, si se considera un disposi-


tivo en el que la región tipo n está menos im~urificada que la región p y en la que,
por tanto, Pno ~npo. lo es epnoDp/Lp = en¡Dp/nnoLp. No obstante, de acuerdo
con (9.3-21), en tanto la estadística de Boltzmann sea válida, nl se puede expresar
en la forma

(14.3-2)

en donde C = UcUJJ'3 es una constante independiente de la temperatura. Al substi-


tuir este valor en (14.3-1) y suponer que 1/10 ~ 1 -lo cual es cierto para todos los
voltajes directos, excepto los muy pequeños- se encuentra que

L\e kT l /Lpnno 3kT


V0 =-+- n - - - - - I n T. (14.3-3)
e e eCDP e

En el rango normal de temperaturas, concentraciones, tiempos de vida, etc., y


para densidades de corriente para las que se puede aplicar esta fórmula, se encuentra
que, el tercer término predomina sobre el segundo y, como resultado, V 0 disminuye
con la temperatura. 4-quí se ha supuesto que la longitud de difusión cambia con la
temperatura sólo a través del cambio en el coeficiente de difusión y, por tanto, que
el tiempo de vida es independiente de la temperatura. Desde luego, cualquier efecto
Rectificadores p-i-n; la caídade voltaje en sentido directo 491

debido a un cambio en el tiempo de vida, en función de la temperatura, se super-


pondrá a los resultados que se dieron para este caso más sencillo. En todos los estudios
subsecuentes se hará el mismo planteamiento.
En el caso del rectificador p-i-n, al funcionar en la condición de polariza-
ción directa a altas corrientes, se debe proceder inicialmente de (14.2-23) y
(14.2-24). Para explicar la variación del coeficiente de difusión Di con la tempera-
tura, se observa que, puesto que los coeficientes de difusión Dp y Dn se relacionan
con las movilidades correspondientes a través de las relaciones de Einstein, entonces,
la difusibilidad ambipolar Di de (10.2-36) se puede escribir como sigue

(14.3-4)

De donde, el coeficiente de difusión efectivo es kT/e multiplicado por una


expresión que incluye la movilidad de electrones y huecos. Si b es lo bastante
independiente de la temperatura, la dependencia de la temperatura de Di se rela-
ciona con la de la movilidad de arrastre de los huecos multiplicada por un factor de
T. De no ser así, la dependencia de temperatura es más compleja, aunque todavía se
puede describir mediante (14.3-4), si se introducen los datos de movilidad de huecos
y electrones. Luego la dependencia de la temperatura de L¡ se obtiene de la de Di
por medio de (14.2-2).
En la práctica la variación con la temperatura de las movilidades se puede
describir también casi siempre mediante una ley de potencias, como, por ejemplo

(14.3-5)

En donde n es una constante positiva, como se vio en el capítulo 9. Si el


mecanismo de dispersión dominante que determina la trayectoria libre media y, por
ende, la movilidad, es la interacción de electrones y huecos, con fonones de modo
acústico, n será 3/2; si el modo óptico o la dispersión entre valles es importante, n
será mayor. En el silicio, n (como se determina experimentalmente) no es muy
diferente de 5/2, tanto para huecos como para electrones. En el germanio, n = 1.65
para electrones y 2.3 para huecos. Si se adopta (14.3-5) para expresar la dependen-
cia de la movilidad en función de la temperatura, y suponiendo que b es práctica-
mente independiente de la temperatura, de acuerdo con (14.3-4), se puede expresar
la variación con temperatura de Di como

Di(T) = Dio (Ty)-n+l


0
(14.3-6)

en donde D¡ 0 es el valor de Di a alguna temperatura de referencia T0 • De igual


modo, se puede escribir

d d ( T )!::....!.
L¡ = L¡o T 0 2 (14.3-7)

en donde

(14.3-8)
492 Uniones p-n a niveles altos de corriente; el rectificador p-i-n

Al substituir (14.3-5), (14.3-6), (14.3-7) y (14.3-2) en (14.3-23) y simplifican-


do, se tiene el resultado

Ae lcT l 2 1: kT
V0 = - + - In - (4 - n) - In T
e e e 2D;~CT 0 - 1 e

+2kT { d- -
--$b
e L;o T0
(T)"- 1
2 }
'
(14.3-9)

que describe la variación general de V0 en función de la temperatura. Obsérvese que


el argumento del logaritmo del segundo término del lado derecho de la ecuación es
independiente de la temperatura.
Cerca del valor óptimo de d/L¡, la dependencia de V 0 de la temperatura se
debe mayormente al segundo y el tercer término del miembro derecho de (14.3-9).
Para este rango de valores de d/L¡, la contribución del último término es muy pe-
queña y la variación general de V0 es descendente al aumentar la temperatura, para
valores típicos de los parámetros del dispositivo. No obstante, cuando d/L¡ se hace
mucho menor que la unidad, iPb(d/L¡) se hace muy grande y el último término
del lado derecho es el que domina, dando como resultado un aumento de Vo
con la temperatura. Este término aumenta con la temperatura no sólo debido al
coeficiente 2kT/e, sino también a causa de la variación del argumento de <Pb con la
temperatura. Cuando d/L¡ se hace apreciablemente mayor que la unidad, iPb se hace
muy grande otra vez y se puede esperar una vez más un incremento de V 0 en
función de la temperatura. Si se particulariza (14.3-9) a los dos casos que se estu-
diaron detalladamente (n = 3/2, correspondiendo a una dispersión reticular de modo
acústico que se aproxima al estado real de cosas en el germanio, y n = 5/2, que es
casi correcta en el caso del silicio), se puede escribir

Ae kT / 2 1: 5 kT 2kT { d 114 }
V0 =-+-In 2 * 112 -- -In T + - <Pb- (T/T0 )
e e e D;oCT0 2 e e L;o

(n = 3/2) (14.3-10)

Ae kT / 2 1: 3 kT 2kT { d 3 4}
V0 = - + - I n 2 D* CT 312 - -2 -In T + - <Pb -L (T/T0 ) 1 •
e e e ;o 0 e e ;o

(n = 5/2) (14.3-11)

Los resultados que predicen estas ecuaciones para un conjunto típico de pará-
metros del dispositivo y para una densidad de corriente de 100 amp/cm 2 , se ilustran
en la figura 14.7. Es evidente que la tendencia de V0 puede ser ascendente o bien
descendente con la temperatura, de acuerdo con el valor de d/L. Una vez más, es
obvio que la magnitud de la caída de voltaje directo es muy sensible al tiempo de
vida de los portadores en exceso de la región central y que aumenta rápidamente al
reducirse este tiempo, después de pasar un punto mínimo. Estas conclusiones se
verifican casi siempre mediante las características de dispositivo que se han observado
de un modo experimental. Se debe observar que la dependencia en función de la
temperatura de la movilidad de arrastre, desempeña un papel importante para deter-
minar este mismo tipo de dependencia de la caída de voltaje directo. Las estructuras
Rectificadores p-i-n; la caída de voltaje en sentido directo 493

24
~
1
22 1
1
1
~
20

1T=0625~s 1 Variaci6n de Vf en
función de T en un
18 1 1 rectificador p-i-n
1
1 1
16 1 1
L 1
.. /
/~
o
> 14
o
> /
/
12 / /
,........ ......... '\
10 - --- T=l56~s

- - - - ~- r -'12
- - - ~-r-Stz I = lOO amp 1 cm 2
d=OOicm

04~------~------~------~------~--------~
o 50 100 150 200
r, •e

Figura 14.7. Caída de voltaje directa de un rectificador p-i- n, graficada en función de la


temperatura, a una densidad de corriente constante de 100 A/cm2 para los dos
casos p.o:T-3/2 (curvas continuas) y JPXT-5/2 (curvas punteadas).

de dispositivos en las que la caída de voltaje directo aumenta al incrementarse la


temperatura, se consideran casi siempre indeseables, ya que cuando se calientan exce-
sivamente, debido a las corrientes de sobrecarga, aumenta su disipación de potencia
interna y tiende a calentarse en exceso, quemándose prematuramente. Por otro lado,
las unidades en las que la caída de voltaje directo disminuye al aumentar la tem-
peratura, disipan menos potencia en sentido directo cuando están calientes que cuando
do esttm trías, son mucho más estables cuando portan corrientes elevadas y, en
general, son mucho más tolerantes a las sobrecargas momentáneas o permanentes. Si
se desean más detalles y explicaciones sobre la teoría de los rectificadores p-i-n,
conviene leer el artículo original de Hall 5 y el análisis muy minucioso que se hace
del tema en la serie de artículos escritos por Herlet y Spenke. 6

5 R. N. Hall, Proc. lnst. Radio Engrs., 40, 1512 (1952).


6 A. Herlet y E. Spenke, Z. Angew. Phys., 1, 99 (1955); 7, 149 (1955); 7: 195 (1955).
494 Uniones p-n a niveles altos de co"iente; el rectificador p-i-n

EJERCICIOS
l. Para el rectificador de germanio p+-i-n+ que se vio en relación con la figura 14.4,
encuentre la longitud de difusión a corriente baja Lp en la región central, de acuerdo con la
corriente de saturación dada, suponiendo que la capa central es material de tipo n, con una
resistividad de equilibrio de 1 ohm-cm a 300°K, que toda la corriente de saturación es de
huecos, dehido a la generación térmica en la región n. Si L¡ a niveles altos de corriente es del
orden de Le, ¿se tratará de un dispositivo con pérdidas internas casi óptimas a niveles altos de
corriente? Compare la disipación de potencia interna de este dispositivo en la región de polariza-
ción directa, a un nivel de corriente de 50 amp/cm2, tal como lo indican los datos experimen-
tales de la figura 14.4, con la disipación de potencia en sentido inverso a un voltaje de V0 =
- 500 V, como se calculó mediante la teoría de nivel bajo de la sección 13.1.
2. Muestre explícitamente los pasos algebraicos requeridos para obtener la ecuación
(14.2-21), a partir de (14.2-20). Obsérvese que

____dx_ _ _ _ = cxvol-b tan- (e-•xja_-_b) + const.


Jacoshcxx+bsenhcxx - 2
a+b 2
1

3. Demuestre (a) que en el caso especial b = 1, (14.2-24) se reduce a

(b) que para ~> 1, (14.2-24) puede aproximarse mediante

(e) que para ~o:¡¡,;1, (14.2-24) se puede aproximar por medio de

4. Demuestre que para una densidad de corriente directa constante dada, en la región de
altos niveles de corriente, la mínima caída de voltaje se obtiene cuando la relación ~ = d/L¡
satisface la condición ~(d<l>b/d~ = l.
5. De acuerdo con los cálculos anteriores de la sección 14.2 demuestre que la teoría de
altos niveles de corriente desarrollada ahí es válida para densidades tan grandes, que permitan
que se satisfaga la desigualdad (14.2-24).
CAPITULO 15
Otros dispositivos semiconductores

15.1 EL EFECTO FOTOVOLTAICO p-n Y LAS CELDAS


FOTOVOLTAICAS DE UNION p-n

Si una umon ordinaria p-n se pone en cortocircuito en la oscuridad, como


se ilustra en la figura lS.l(a), no habrá un flujo de corriente en el circuito externo,
a pesar de que existe un potencial c/Jo entre las regiones p y n del dispositivo. La
razón es que se desarrollan diferencias de potencial de contacto entre las regiones p
y n del semiconductor y los cables metálicos que anulan precisamente el potencial
interno en equilibrio. Era de esperarse tal situación, de acuerdo con una base de la
termodinámica, ya que, de otra manera, habría un flujo de corriente y se haría un
trabajo sin ninguna energía de entrada, lo cual violaría la primera ley de la termodi-
námica.
Si se permite que caiga una luz en la uni6n p-n, como se indica en la figura
lS.l(b), la situaci6n cambia materialmente y se pueden observar voltajes y co-
rrientes mensurables. En primer lugar se estudiará el caso en que una uni6n p-n
está en circuito abierto. La luz que cae en las regiones p y n, a ambos lados de la
unión, crea muchos pares electrón-hueco en exceso, en ambas regiones. El exceso de

Potencial de contacto
cuya suma es- 4> 0
</>.o

Difusión de
exceso de

(a) -
electrones
tipo-p ti po-n

+
Ponteciómetro
( b)

Figura 15.1 (a) Una unión p-n "en corto" en el estado de equilibrio. (b) Una unión p-n
iluminada, que presenta el efecto fotovoltaico.

495
496 Otros dispositivos semiconductores

Exceso de electrones -

!.!:t~+~!.~+.!±.~!.i!.t~!.+_+_+
+ + + +
+

+ -------------
---Bordes de banda (oscuro)
-Exceso de huec~s +: + \ ~ ++ + :
------Bordes de banda (luz)

Figura 15.2. Diagrama de energía potencial de una celda fotovoltaica.

electrones creado en la región p puede difundirse a la unión y descender por la


barrera de potencial hasta el lado n, en tanto que el exceso de huecos creado por
excitación óptica en la región n, puede difundirse hasta la unión y "flotar", para
pasar la barrera y entrar a la región p. El efecto de esto es colocar una carga
positiva neta en el lado p y una carga negativa neta en el lado n. La presencia de
estas densidades de carga es tal que reducen la diferencia del potencial de barrera 4> 0
a un valor d!~do 4>o - V0 , como se muestra en la figura 15 .2. El potencial interno
es ahora diferente de los potenciales de contacto equilibrantes y un voltaje igual
a esta diferencia (con una magnitud V0 ), aparecerá como una diferencia de potencial
mensurable en las tenninales del circuito del dispositivo. Este fenómeno se conoce
con el nombre de efecto [otovoltaico p-n y el voltaje de salida se denomina con frecuencia
[otovoltaje. La magnitud de fotovoltaje se puede expresar de acuerdo con las concen-
traciones de portadores minoritarios en exceso en las fronteras de las regiones de carga
espacial de la unión, por medio de (13.1-12) y (13.1-13) o, mejor aún, mediante
(13.1-17) y (13.1-18), de donde

(15.-1)

Si se cierra el circuito externo que conecta las regiones p y n, fluirá una


corriente eléctrica, en tanto exista una corriente de difusión de electrones en exceso
creados ópticamente, desde la región n, y una corriente de huecos en exceso creados
ópticamente, desde la región p, para mantener la altura de la barrera interna a un
valor diferente a 4> 0 • Entonces, la corriente fluirá, con tal que estén iluminadas las
regiones del semiconductor. Es evidente que la fuente de energía que mantiene el
flujo de corriente es la iluminación incidente, que sirve para crear y mantener la
distribución de portadores en exceso desde un principio. En la condición de circuito
abierto, la generación de densidades de corriente que se vieron al comienzo de la
sección 13.1, se incrementan, iluminando el dispositivo, en tanto que las corrientes
de recombinación permanecen inalteradas inicialmente. Las corrientes de difusión no
balanceadas que fluyen, como resultado de esto, motivan una acumulación de carga,
cuyo campo reduce la altura de la barrera interna, incrementando con ello las co-
rrientes de recombinación, hasta que se vuelve a alcanzar un equilibrio entre la
El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n 497

Luz,
' longitud
' de' onda1 A
coeficiente de
absorción o: (A)

Parámetros
del material:

~--~r-~--x+d---4
X

x=-d x=O
I
tipo-p tipo-n
!
Figura 15.3. Geometría y notaciones que se usan en la celda fotovoltaica p-n de 1a sec-
ción 15.1.

corriente de generac10n y la de recombinación; para mantener un voltaje en las


terminales del dispositivo. En la condición de circuito cerrado, las corrientes de
generación son siempre mayores que las de recombinación (las que, por supuesto, no
tienen una dependencia inherente, con la intensidad de la luz), y estas corrientes de
generación son las que constituyen la fuente de la corriente que fluye en el circuito
externo.
Supóngase que una celda voltaica se fabrica, difundiendo impurezas tipo p en
un semiconductor que inicialmente es tipo n, de tal manera que se forma una capa
delgada tipo p en la superficie. A continuación, la celda se ilumina mediante luz
monocromática incidente, en la superficie tipo p. La situación física resultante se
puede representar mediante el modelo unidimensional que aparece en la figura 15.3,
en donde las regiones uniformes n y p están separadas por una unión abrupta
p-n. 1 Se hará caso omiso de la extensión de la región de carga espacial en la
unión, ya que, en las condiciones usuales en las que opera el dispositivo, el espesor
de las dos capas de carga espacial es extremadamente pequeño. Puesto que la luz
incidente es monocromática, su intensidad dentro del cristal se reducirá exponencial-
mente, en función del coeficiente de absorción o:, que, por supuesto, variará con la
longitud de onda, que es muy grande para energías de fotón mayores que ~e y
muy pequeña para energías de fotón mucho menores que ~e. Si el número de
fotones de longitud de onda A que entran en la superficie frontal del dispositivo por
unidad de área, por unidad de tiempo es N0 (A), el flujo de fotones a cualquier
profundidad x será

(15.1-2)

El número de pares electrón-hueco por unidad de área, por unidad de tiempo,


generados por la absorción de fotones en una distancia dx alrededor de x, será igual

l. Para un estudio completo del efecto fotovoltaico p-n, véase, de R. Wiesner, Halbleiter-
probleme, Vol. III, Friedrich Vieweg u. Sohn, Braunschweig (1956), p.p. 56-71.
498 Otros dispositivos semiconductores

a -(dN(x)fdx)dx, de donde, la velocidad de generación de portadores en exceso


g' (x) estará dada por

(15.1-3)

En estas circunstancias, las ecuaciones de continuidad para huecos en exceso en


la región n y los electrones de la región p se pueden escribir como sigue

d 2(np- npo) nP - npo


- - -aNo
- e -«(x+d) (x <O) (15.1-4)
dx 2 L: - Dn

d 2(Pn- Pno) Pn- Pno =aNo e-~<x+d)


(x > 0). (15.1-5)
dx 2 L2p DP

Las soluciones de este tipo de ecuaciones se pueden escribir como la suma de


la solución de la ecuación homogénea correspondiente a una solución particular de la
ecuación no homogénea que pueda encontrarse. Por ejemplo, se puede buscar una
solución particular a (15.1-4) de la forma Ce -«(x+d> • y encontrar que esta solu-
ción satisfará2 efectivamente (15.1-4), a condición de que la constante C tenga el
valor

(15.1-6)

Luego la solución general de (15.1-4) se puede escribir como

(15.1-7)

mientras que, en forma similar, la solución general de (15.1-5) se puede expresar en


la forma 3

(15.1-8)

En el modelo ilustrado en la figura 15.3, se considera que el dispositivo tiene


una extensión esencialmente infmita en la dirección + x. Por tanto, puesto .que
Pn(x)- Pno debe decaer hasta cero para valores grandes de x, la constante arbitraria
C de (15.1-8) debe ser cero. Las otras tres constantes arbitrarias de (15.1-7) y
(15.1-8) se pueden ev:>Juar, aplicando las condiciones usuales de frontera (13.1-17) y
(13.1-18) en la unión, y la condición de frontera superficial en x =-d. En la
situación que se está viendo, esto se puede escribir como

2 Obsérvese que la solución que se encontró en esta forma no es general, puesto que no
contiene ninguna constante arbitraria. La solución general es la suma de la solución de la
ecuación homogénea correspondiente (que contiene las dos constantes arbitrarias requeridas) y
esta solución particular.
3. Por lo general, es más conveniente, por razones algebraicas, escribir la solución de la
ecuación homogénea en términos de funciones exponenciales en una región infmita o semiinfmita
y en términos de funciones hiperbólicas en una función de extensión finita.
El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n 499

np(O) = Pn(O) = eeYo/kT (15.1-9)


npo Pno
y
d(n - n 0 ))
Dn ( P dx P -d = s · (np( -d)- np 0 ). (15.1-10)

Siguiendo este procedimiento, puede demostrarse que

(15.1-11)

~15.1-12)

s cos - + -
= Ln
d Ln
Dn
sen -
Ln dl + 1a.Notn ( S+ a.Dn l (15.1-13)
B
1
A D d
__!! cos - + s sen -
Ln Ln
d
Ln
- a. 2L 2
"
D
__!!
Ln
cos -
d
Ln
+ s sen -
Ln
d .

La corriente de unión

(15.1-14)

se puede evaluar ahora para dar la ecuación de corriente-voltaje para el dispositivo. 4


El resultado se puede expresar en la forma

(15.1-15)

en donde

(15.1-16)

es una corriente de saturación que es una función sólo de los parámetros dimensio-
nales y de material del dispositivo, independientes del nivel de iluminación y donde
_ ea.N 0 L!e-ad (_!___a.) ea.N 0 L!
lg- 1-a.2L2p L p +1-a.2L2n

{15.1-17)

4. Al hacer esto, es más sencillo dejar las expresiones para las concentraciones de portado-
res en exceso en la forma de (15.1-7) y (15.1-8), insertando las expresiones (15.1-11, 12 y 13)
para las constantes arbitrarias, sólo al final.
500 Otros dispositivos semiconductores

Figura 1 5.4. Relación corriente-voltaje de un dispositivo fotovoltaico p-n en diferentes intensi-


dades de iluminación, indicando la construcción de la "línea de carga".

es una corriente de generac10n independiente del voltaje de umon V 0 ; pero directa-


mente proporcional a la intensidad de iluminanción, según la representa N 0 . La
corriente de generación (15.1-17) representa la parte de la corriente de electrones y
huecos en exceso creados por la luz incidente que logra difundirse hasta la unión. Se
puede demostrar fácilmente que la corriente de generación de huecos, tal como la
representa el primer término de (15 .1-17), es siempre positiva, sean cuales fueren las
magnitudes relativas de o:, L-p 1 y d; los detalles de esta demostración quedan como
ejercicio para el lector. Demostrar que lo mismo puede decirse de la corriente de
generación de electrones para la región p; es mucho más difícil pero, intuitivamente,
debe ser evidente.
Las relaciones corriente-voltaje dadas por (15.1-15) se ilustran en la figu-
ra 15.4, para varias intensidades de luz incidente. Se puede ver inmediatamente que
si N 0 =O, la relación corriente-voltaje es la de un diodo ideal p-n mientras que
cuando N 0 aumenta, la corriente de generación se incrementa proporcionalmente,
dando origen a la familia de curvas que se muestra en el diagrama. También se
ilustra una. "línea de carga" correspondiente a un valor dado de la resistencia del
circuito; esto establece un punto de operación correspondiente a un voltaje de salida
VP y una densidad de corriente de salida lp. Por supuesto, si la resistencia del
circuito es infmita, correspondiendo a las condiciones de circuito abierto, I se des-
vanece y, de acuerdo con (15 .1-15), el voltaje del circuito abierto es

Voc = -kT
e
In ( l + -lg) .
1
(15.1-18)
0

Este es el voltaje máximo que se puede obtener del dispositivo en un nivel


dado de iluminación. Como lo indica (15.1-18), el voltaje de circuito abierto aumen-
ta logarítmicamente con lg (y, por tanto, con la intensidad de la iluminación),
cuando lg ~ 10 • De acuerdo con la figura 15.2, se puede ver claramente que el
voltaje máximo de circuito abierto que se puede obtener es del orden del potencial
interno t/Jo. Si la resistencia del circuito (incluyendo la resistencia interna del dispo-
sitivo mismo) es cero, entonces, V 0 se hace tan pequefio que puede desecharse y
fluye una corriente máxima de cortocircuito, correspondiente a la densidad de
corriente
(15.1-19)
El efecto fotovoltaico p-n y las celdas fotovo/taicas de unión p-n 501

En ambos casos, la potencia dada al circuito externo, como la expresa el


producto JV0 es cero. Como se vio antes, es evidente que la máxima potencia se
entrega a un circuito externo en circunstancias que son intermedias entre los dos
extremos, por ejemplo en condiciones tales como las que se obtienen en el punto P,
en la figura 15.3. No es difícil determinar con precisión la resistencia del circuito
que origina la máxima potencia de salida y esto se recomienda como ejercicio para
el lector.
De acuerdo con (15.1-15) y la figura 15.4, es evidente que mientras más
grande es la corriente generada lg, tanto más grande es la potencia proporcionada al
circuito externo y más alta la eficiencia de conversién de energía lumínica a energía
eléctrica. Aunque la generación de corriente es, en todos los casos, directamente
proporcional a la intensidad de la iluminación, existen otros factores que tienen un
papel importante en la determinación de la magnitud de lg. De acuerdo con
(15.1-17) -y esto se ve intuitivamente-, es obvio que los tiempos de vida largos
(por tanto, grandes longitudes de difusión en las regiones n y p) ayudan a producir
grandes valores de lg. Del mismo modo, es evidente que la recombinación superficial
sólo puede reducir las corrientes de difusión que puedan fluir a través de la unión y,
por ende, una reducción en la velocidad de recombinación superficial dará como
resultado, invariablemente, un valor incrementado para la densidad de corriente gene-
rada. Además, la profundidad de la unión por debajo de la superficie iluminada es
un factor crítico. Si la unión es demasiado profunda, toda la luz será absorbida lejos
de su parte delantera y las corrientes de difusión tendrán que fluir una gran distan-
cia y sufrir una reducción enorme, debido a la recombinación volumétrica, antes de
llegar a la unión. Por otro lado, si es muy poco profundo, gran parte de la luz
penetrará más allá de ella, antes de que pueda absorberse y, nuevamente, las corrien-
tes de difusión tendrán que recorrer un largo trecho. La profundidad ideal es del
orden de la distancia de decaimiento exponencial 1/cx asociada con la absorción de la
luz incidente. Puesto que el voltaje máximo de circuito abierto que puede obtenerse
bajo una iluminación intensa es del orden del potencial interno cf>o, es ventajoso
utilizar niveles de impurificación relativamente grandes, tanto en la región n como en
la p, para obtener el mayor valor posible para esta cantidad. Del mismo modo,
puesto que no se producen portadores en exceso, cuando la banda prohibida de energía
~€ sobrepasa a la energía del fotón de la luz incidente, que gran parte de la energía de
los fotones se pierde en el calentamiento del cristal, si ~€ es mucho menor que la
energía del fotón incidente, la máxima eficiencia de conversión de energía se obtiene
cuando ~€ = he/A.
Toda la exposición anterior se ha basado en una situación en la que la celda
fotovoltaica se ilumina con radiación monocromática. En la mayoría de las aplica-
cioqes actuales de este tipo de dispositivos, la fuente lumínica es la luz solar que,
por supuesto, tiene un amplio espectro continuo de longitudes de ondas. En este
caso, es necesario calcular la distribución espacial real de la generación de porta.dores
en exceso, lo cual ya no será la función exponencial simple (15 .1-3 ), sino una
superposición de muchas funciones exponenciales de esta naturaleza, que representan
muchas longitudes de onda, cada una de las cuales tiene un coeficiente de absorción
característico cx(A.) que se obtiene del espectro óptico de absorción observado del
cristal semiconductor, y cada uno tiene un factor característico de intensidad N 0 (A.),
de acuerdo con la longitud espectral de la luz solar a cada longitud de onda.
Entonces, g'(x) se representaría idealmente como una integral de la cantidad
cx(A.)N0 (A. )e -•<x +dl sobre la longitud de onda y las ecuaciones de continuidad se
convertirían en ecuaciones integrales que, en este caso, no todas admiten una solu-
ción analítica. La única alternativa posible es seguir usando técnicas numéricas y
esto, evidentemente, está fuera del alcance de este trabajo para lograr algún progreso
en esta dirección. No obstante, se debe hacer notar que la validez general de los
502 Otros dispositivos semiconductores

resultados obtenidos en el caso monocromático se extienden, aun en esta situación


más compleja. Por ejemplo, es muy conveniente usar un semiconductor en el que tl.e
sea lo más parecido posible a la energía de fotón, a la longitud de onda de la
máxima intensidad espectral y ubicar la unión a una profundidad que corresponda a
la profundidad de absorción media de la longitud de onda de la máxima intensidad
espectral.
La energía de fotón asociada con la máxima intensidad espectral a la luz del
sol es aproximadamente 2 eV. Desafortunadamente, los semiconductores que tienen
este valor de tl.e y que existen en la actualidad (GaP, SiC, etc.) son muy poco
satisfactorios para lograr que las celdas fotovoltaicas sean eficientes, debido a los
tiempos de vida excesivamente cortos de los portadores en exceso que, invariable-
mente, se asocian con ellos. La banda prohibida de energía del germanio es dema-
siado baja para obtener una eficiencia óptima y, además, los voltajes de salida que se
obtienen son también muy bajos. Las mejores celdas fotovoltaicas para iluminación
solar, que se han obtenido hasta la fecha, se han fabricado de silicio; aunque el
arseniuro de galio se ha utilizado con cierto éxito. Los mejores dispositivos fotovol-
taicos de silicio pueden convertir un 1S por ciento de la radiación solar incidente en
energía eléctrica, dando voltajes de salida de 0.55 a 0.6 V y densidades de corriente
de, aproximadamente, 45 ma por cm 2 • Estos dispositivos se utilizan en grandes
cantidades como fuentes de energía primaria para sistemas de potencia de los saté-
lites.

15.2 OTROS DISPOSITIVOS SENSIBLES A LA LUZ:


FOTOTRANSISTORES, DETECTORES DE PARTICULAS
Y DETECTORES INFRARROJOS

Además de las celdas fotovoltaicas p-n, que se vieron detalladamente en la


sección anterior, existen muchos otros tipos de dispositivos, que funcionan basándose
en la generación de pares de portadores en exceso por medio de una excitación
óptica o de partículas elementales.
Las celdas fotoconductivas se basan en el incremento de la fotoconductividad
de cd, bajo una iluminación, con el fin de proporcionar una señal eléctrica propor-
cional a la intensidad de la radiación de excitación. El funcionamiento de los dispo-
sitivos de esta naturaleza se analizó ya en forma bastante detallada en la sec-
ción 10.6. Las celdas fotoconductivas de sulfuro de cadmio tienen un uso muy
difundido como elementos sensores en cámaras y medidores de exposición fotográ-
fica. Las celdas fotoconductivas en las que la ionización de niveles donadores pro-
fundos, a bajas temperaturas, por medio de una radiación incidente, da origen a la
fotoconductividad, se usan muy a menudo como detectores infrarrojos. El germanio
impurificado con oro se usa con mucha frecuencia con este fin.
El transistor de unión en el que se introduce un exceso de pares electrón-
hueco en la región de base, mediante una excitación óptica, en lugar de utilizar un
emisor de unión p-n, se conoce con el nombre de fototransistor. En la figura 15.5
se ilustra este dispositivo. En el fototransistor, el exceso de pares electrón-hueco
creados por la luz incidente, se difunden y recogen mediante la unión de colector
con polarización inversa. En efecto, los portadores en exceso generados por la luz
contribuyen a la corriente de saturación térmica de la unión de colector. El foto-
transistor es capaz de mayor sensibilidad como detector de radiaciones que la celda
fotovoltaica o las celdas fotoconductivas y, mediante un diseño y un funcionamiento
adecuados, puede operar con gran eficiencia para detectar señales de luz a niveles
Rectificadores controlados p-n-p-n 503

''Región de la base"

Conector Al amplificador
junction u otro detector
+ -
'-------;1,11---~

Figura 15.5. Diagrama esquemático del fototransistor o detector de radiación.

muy bajos. Puesto que los pares de electrón-hueco pueden producirse mediante haces
incidentes de rayos X, rayos r, y otras partículas elementales, tales como electrones,
protones o partículas a:, al igual que la luz, los dispositivos que tienen esta estruc-
tura funcionan admirablemente como detectores de partículas nucleares. Puesto que
se crea un número muy grande de pares electrón-hueco cuando una partícula nuclear
con una energía de varios MeV se detiene dentro de un cristal de silicio o germanio
(el número se puede calcular, aproximadamente, observando que se obtiene un par
electrón-hueco por cada tres eV de energía inicial de partícula, tanto en el silicio
como en el germanio), la detección de una sola partícula nuclear se logra con suma
facilidad. La magnitud del pulso de corriente resultante es más o menos proporcional
a la energía de la partícula incidente, que permite la determinación de los espectros
de energía, mediante el análisis de la altura de los pulsos.

15.3 RECTIFICADORES CONTROLADOS p-n-p-n

El rectificador de avalancha controlada p-n-p-n es una estructura de cuatro


capas, como se descri~ .en la figura 15.6. Por lo general, está discfiado con densi-
dades de impurezas mucho más fuertes en las capas externas que en las internas y,
por tanto, podría identificarse más correctamente como un dispositivo p+-n-p-n.... El
rectificador controlado p-n-p-n se puede considerar como dos transistores, uno
p+-n-p y otro n-p-n+, con una unión de colector común, como se ilustra. La unión

Sección p+-n-p
•1 e •z

+
• ...=.. I 01 =I. 2 =Ic Carga
Sección n·p-n+

Figura 15.6. Diagrama esquemático de un dispositivo de conmutación de cuatro capas p·n·p·n.


504 Otros dispositivos semiconductores

e 1 es la unión de emisor de la sección p+-n-p, en tanto que e2 es el emisor de la


sección n-p-n+. La unión e es una unión de colector común a ambas secciones.
Cuando se aplica un voltaje de alimentación, como se indica, se tendrá una unión
con polarización inversa en d dispositivo. Si a 1 es la ganancia de corriente de la
sección p+-n-p y a2 es la ganancia de corriente de la sección n-p-n+, entonces,
utilizando la misma línea de razonamiento que se aplicó al caso de la autoamplifica-
ción de base abierta de la corriente de colector para un transistor p-n-p en las
ecuaciones (13.6-50) y ( 13.6-51 ), se puede escribir

(15.3-1)

en donde feo es la corriente de saturación del colector. Sin embargo, puesto que

(15.3-2)

la ecuación (15.3-1) se puede expresar en la forma

(15.3-3)

Ya se vio que, de acuerdo con las suposiCIOnes que se hicieron en la sec-


cwn 13.6, la ganancia de corriente de un transistor de unión debe ser independiente
de la corriente de emisor, excepto a valores grandes de ésta, en donde debe decre-
cer, debido a la reducción de la eficiencia de inyección a altos niveles de corriente.
No obstante, la ganancia de corriente varía con la corriente de emisor, también a
niveles de corriente muy bajos; se eleva a partir de un valor bastante bajo en le = O,
con gran rapidez, hasta que se obtiene el valor predicho por (13 .6-31), y luego se
hace prácticamente independiente de 1e, hasta que se establece la reducción a una
densidad de corriente elevada, debido a la degradación de la eficiencia de inyección.
Este estado de cosas, que se ilustra en la figura 15.7, se debe, en parte, a los
efectos de fuga de superficie en la unión, o bien, a la recombinación dentro de la
región de carga espacial de la unión. En todo caso, al aumentar el voltaje de fuente,
la corriente de colector permanece casi constante a un valor pequeño, que es el que
da (15.3-3), en donde a 1 y a 2 se refieren a los valores de estas ganancias de
corriente en algún punto de la región de baja corriente (!<Ion de la figura 15.7).
En esta región, a 1 + a 2 es menor que la unidad y llega a una condición de funcio-
namiento estable en el que la corriente que fluye a través del dispositivo es baja y
la caída de voltaje (que aparece en su mayor parte en la unión central del colector),
puede ser muy grande. Al aumentar el voltaje de alimentación, se llega a un punto
en el que comienza a producirse la ruptura de avalancha en la unión central. En este
punto (que sigue estando dentro de la región de prerruptura), la corriente de colec-
tor aumenta un poco y las ganancias de corriente a 1 y a 2 se incrementan en forma
correspondiente, como se señala en las figuras 15.7, hasta que se llega a un punto
crítico (le= 10 n) en donde la suma de a 1 y a 2 alcanza la unidad. Como lo predice
(15.3-3), se produce una inestabilidad en este punto "de encendido". la corriente
aumenta con gran rapidez y el dispositivo cambia de un estado de alto voltaje, y
corriente baja, a otro de bajo voltaje y corriente alta, en el que la fuerte amplifica-
ción regenerativa de las corrientes de portadores en exceso inyectadas por las unio-
nes de emisor, mantienen grandes densidades de portadores en exceso, dentro de las
dos regiones centrales del dispositivo, dando origen a una condición en la que la
impedancia es muy baja. Se llega a un punto de operación estable a corriente alta e impe-
dancia baja, cuando la corriente aumenta tanto que, debido a la reducción de la
Rectificadores controlados p-n-p-n SOS

Ganancia de
corriente

1<:: Punto-J.
1lop

Punto de de
encendido operación del
estado "on"

Figura 1S. 7. Ganancias de corriente a¡ y a2 de las dos secciones de transistor de un disposi-


tivo de conmutación de cuatro capas trazado en función de la corriente.

ganancia de corriente con la corriente de emisor, en la región de alta corriente, la


suma de a 1 y a 2 vuelve a descender a la unidad; este punto se identifica como Iop
en la figura 15.7. El dispositivo sigue en el modo de alta corriente hasta que se
interrumpe el voltaje de alimentación, momento en el que (después de un corto
tiempo de recuperación, del orden del tiempo de vida de los portadores en exceso
dentro de las regiones internas) se reanuda una vez más, el modo de corriente baja.
La acción de conmutación se puede iniciar no sólo con el principio de la ruptura de
avalancha, sino también inyectando un pequeño pulso de corriente (de la magnitud
suficiente para incrementar la corriente de colector hasta el punto en el que a 1 + a 2
sobrepasa a la unidad) a un "electrodo de compuerta" conectado a una de las
regiones internas. De esta manera, el dispositivo se puede conmutar a voluntad.
Las características de corriente-voltaje de un rectificador controlado p +-n-p-n +
se ilustran esquemáticamente en la figura 15.8. Los dispositivos de este tipo, hechos
de silicio, pueden soportar voltajes hasta de casi 1000 V en el modo de alta impe-
dancia, y portar corriente de carga de varios cientos de amperes, en el estado de
baja impedancia. En las dos regiones internas del dispositivo, las concentraciones de

1 compuerta = O

, ' 11 compuerta> O
'V 1

~~·~--~-~-==~~~~~~============-/
Figura 1 S.S. Relación corriente-voltaje dr un interruptor de cuatro capas.
506 Otros dispositivos semiconductores

portadores en exceso son casi siempre mucho mayores que los valores de equilibrio a
niveles de operación de la corriente de carga, y en este modo de operación, el
dispositivo se parece mucho a un rectificador p-i-n, en el que el papel de la región i
está desempeñado por las dos regiones internas. Los dispositivos de esta naturaleza
han encontrado una aplicación tecnológica muy difundida como conmutadores, dis·
positivos de control de potencia, inversores y convertidores de frecuencia.

15.4 DIODOS TUNEL

B diodo túnel es un dispositivo semiconductor que se hace en forma muy


semejante al rectificador ordinario de aleación p-n, excepto que las dos regiones p y
n tienen tantas impurezas como sea posible y el ciclo térmico asociado con el
proceso de aleación se realiza con suma rapidez, para proporcionar poca o ninguna
oportunidad de que se produzca una difusión de estado sólido de los átomos de
impurezas donadoras de la región n a la p y viceversa. Así se logra una transición

<cp

1
<cp----,

Barrera para
el efecto
túnel - -......
" Efecto túnel
con electrones

<en

tipo-p
------•vn \..
(a) equilibrio (b) Polarización inversa

fcp------...
fcp-----

Efecto túnel
con electrones

(e) Pequeña polarización directa (d) Polarización directa mayor


Figura 15.9. Diagramas de potencial, que ilustra el funcionamiento del diodo túnel.
Diodos túnel 501

muy abrupta del material p+ al n+, dentro del cristal y, en consecuencia, la región
de carga espacial de la unión es muy angosta y da origen a campos eléctricos
extremadamente grandes. Esto se ilustra mediante las cifras de la tabla 12.1 ; un
diodo túnel típico puede tener densidades de impurificación de 10 18 ó 10 19 cm- 3 ,
tanto en la región p como en la n. En cristales en los que el contenido de impu-
rezas es tan grande, la aproximación de Boltzmann ya no puede aplicarse, la distri-
bución electrónica se degenera y el nivel de Fermi está, en realidad, dentro de la
banda de conducción o de valencia, según que el semiconductor sea tipo n o p,
respectivamente. Por tanto, el diagrama de las bandas de energía en equilibrio del
diodo túnel es tal como se describe en la figura 15.9(a).
En el diodo túnel es tan abrupta y la región de carga espacial tan delgada, que
la barrera de energía potencial [que aparece en la figura 1S.9(b) ], que separa a los
electrones de la banda de valencia de los estados de igual energía en la banda de
conducción es lo suficientemente angosta, incluso en ausencia de una polarización
inversa, que permite que se produzca la formación de un túnel cuántico de elec-
trones a través de la barrera. En el estado de equilibrio, sin que se aplique ningún
voltaje de polarización, la formación de túnel de los electrones procede con la
misma probabilidad en ambas direcciones, de manera que no se tiene un flujo neto
de corriente.
Si se aplica un voltaje de polarización inversa, como en (b) de la figura 15.9,
las distribuciones electrónicas a ambos lados están desplazadas verticalmente la una
con respecto a la otra, en una cantidad igual al voltaje de polarización. En esta
condición, los estados vacíos del lado n están frente a los estado llenos del lado p y
los electrones de estos estados forman un túnel a través de la barrera potencial para
proporcionar grandes corrientes netas. El dispositivo no soporta ningún voltaje en
absoluto en la dirección inversa; pero puede considerarse que sufre una ruptura
mediante el mecanismo de Zener a valores infinitesimalmente pequeños de voltaje
aplicado.
En sentido directo, la corriente de túnel comienza a fluir al principio por este
mismo mecanismo, como se indica en (e) de la figura 15.9; pero, después de que el
voltaje de polarización directa aumenta más allá de cierto punto, las bandas "se
descruzan" como se muestra en (d) y, entonces, ya no hay más estados finales para
la formación de túneles, de manera que la corriente de túnel desciende bruscamente.
Al aplicar voltajes de polarización directa todavía mayores, la corriente normal de
difusión directa o inyección asociada con cualquier rectificador p-n comienza a fluir
sobre la barrera de potencial en una cantidad importante y la corriente vuelve a
aumentar.
El resultado de tales procesos sucesivos es una curva característica de corriente-
voltaje, como la que se ilustra en la figura 15.10, con una región de resistencia
negativa. La característica de resistencia negativa del dispositivo se puede utilizar
para hacer que la unidad funcione como un amplificador, un oscilador o un dispo-
sitivo de conmutación. Puesto que el proceso de formación de túnel (en contraste
con la difusión) es prácticamente instantáneo, los diodos túnel se pueden usar a
frecuencias muy elevadas (h~sta 10.000 me, en la práctica) como amplificadores u
osciladores. En los diodos túnel de germanio, la relación de las corrientes máxima a
mínima puede ser hasta de 15, siendo las corrientes máximas de una fracción de
miliampere, hasta posiblemente un ampere, que puede obtenerse a través de modifi-
caciones apropiadas en el procedimiento de fabricación. Los diodos túnel se han
fabricado de silicio y GaAs, con excelentes resultados. La densidad de corriente de
túnel observada en el pico de la curva corriente-voltaje, depende enormemente de la
densidad de impurezas en las regiones n y p del dispositivo. Con altas concentra-
ciones de impurezas, la región de carga espacial es muy angosta, la barrera de túnel
extremadamente delgada y la máxima densidad de la corriente de túnel puede ser
508 Otros dispositivos semiconductores

!(mal
5

3
Región con
"exceso de corriente"
2

, ~Corriente de difusión

01 03 04 05 06

Figura 15.10. Relación corriente-voltaje de un diodo túnel típico (curva continua) en compara-
ción con los valores predichos para las corrientes de túnel y difusión (curva'
punteadas).

muy grande. En el germanio, con densidades de impurezas cercanas a 10 20 cm- 3 , se


han observado densidades de corriente de túnel de casi 2000 amp cm- 2 • Con me-
nores concentraciones de impurezas, se reduce la densidad de corriente de túnel y el
efecto apenas puede observarse a niveles de impureza del orden de 10 18 cm- 3 .
La corriente de túnel se puede calcular, a condición de que se conozcan las
densidades de estados de la banda de conducción y valencia y la probabilidad de
formación de túnel asociada con la barrera de potencial. Puesto que las razones de
transición entre los estados inicial "Y final son proporcionales a la densidad de los
estados iniciales y la densidad de los estados finales, se puede escribir la siguiente
expresión para la corriente de túnel de la banda de conducción a la de valencias

(15.4-1)

mientras que la corriente de túnel, en dirección opuesta se puede escribir como sigue

(15.4-2)

en esas ecuaciones, fc(e) y fv(e) son las funciones de distribución de energía electró-
nica en la banda de conducción en el lado n y la banda de valencia del lado p,
respectivamente, Z es la probabilidad de formación de túnel asociada con la barrer¡;_
y A es una constante. La probabilidad de formación de túnel se puede obtener
como el coeficiente de transmisión de la barrera de potencial para los electrones,

S. Véase el artículo original sobre el diodo túnel de L. Esaki, Phys. Rev., 109, 603 (1958).
Transistores de efecto de campo o unipolores 509

mediante la solución de un problema de barrera de la mecánica cuántica similar al


que se vio en la sección 9.11, en conexión con la dispersión reticular de modo
acústico. El total de la corriente neta de túnel es la suma de las dos corrientes
dadas por (15.4-1) y (15.4-2), o sea,

(15.4-3)

En la condición de equilibrio y sin aplicar ningún Voltaje,/c(e) =fv(e) y (15.4-3) se


reduce a lt =O, como se requiere.
La característica observada de corriente-voltaje para un diodo túnel típico de
germanio es la que aparece en la figura 15.1 O. La contribución de la corriente de
túnel, como lo indica (15.4-3) y la componente ordinaria de la corriente de difusión,
en sentido directo, como la da (13.1-23), están representadas por las curvas pun-
teadas. La suma de estas dos corrientes reproduce muy bien la corriente observada
en la región del túnel y la región de voltajes directos grandes; pero cerca de la
corriente mínima, la densidad de corriente observada es invariablemente mucho mayor
que lo que predice la simple teoría que se explicó antes. Esta "corriente en exceso" cer-
cana al mínimo, se ha adjudicado a la presencia de niveles de energía en la región prohi-
bida (debido al atrapamiento de impurezas o imperfecciones estructurales), y a una modi-
ficación de la densidad actual de la curva de estados en las bandas de conducción y
valencia, mediante la introducción de impurezas donadoras y receptoras, en concen-
traciones tan grandes que los estados donadores y receptores forman bandas de
niveles que pueden ser lo suficientemente anchas en las circunstancias reinantes, para
superponer las bandas de conducción y valencia. 6

15.5 TRANSISTORES DE EFECTO DE CAMPO O UNIPOLARES

En el transistor de efecto de campo (o transistor unipolar), se puede lograr la


amplificación de un voltaje de entrada, aplicando la señal a un electrodo que con-
trola la anchura de un canal angosto que porta corriente, haciendo variar la anchura
de la regíón de carga espacial asociada con una unión p-n, como se indica en la
figura 15.11. En general, una corriente de carga (denominada a veces corriente de
fuente) debe fluir a través de un canal angosto que está unido a un lado, por lo

Regi6n-p (muy impurificada)

Polarizaci6n
+
=
Figura 15.11. Diagrama esquemático de un transistor de efecto de campo y sus circuitos asociados.

6. Véase T. P. Brody, J. Appl. Phys., 32, 746 (1961).


510 Otros dispositivos semiconductores

menos, con la región de carga espacial relacionada con una umon p-n. Conforme
varía el voltaje inverso de esta unión, la extensión de la región de carga espacial y,
por tanto, la conductancia del canal, varía en forma correspondiente.
La terminal de entrada de corriente del canal de un transistor de efecto de
campo se denomina casi siempre electrodo de fuente, la terminal de retorno del
canal es el electrodo de drenaje y la terminal de entrada de señal es el electrodo de
compuerta. Aunque no se dará aquí un análisis completo del comportamiento de
estos dispositivos, 7 conviene señalar que sus características eléctricas son bastante
análogas a las del pentodo común al alto vacío. 8 Tanto el transistor de efecto de
campo como el diodo túnel son dispositivos algo especiales entre los semiconducto-
res, en el sentido de que no dependen de la inyección o el transporte de portadores
minoritarios para poder funcionar; más bien utilizan esencialmente sólo el transporte
de portadores mayoritarios para efectuar la función que se requiere del dispositivo.
Este estudio de los dispositivos semiconductores no es, de ninguna manera, lo
suficientemente general; pero ha incluido sólo algunos de los ejemplos más impor-
tantes y algunos otros cuya operación ilustra fenómenos físicos importar1tes que
ponen en claro técnicas analíticas de aplicabilidad general. Un estudio sistemático de
los numerosos dispositivos semiconductores que usa la tecnología actual es imposible
de realizar en un trabajo del alcance de esta obra. Estos dispositivos incluyen detec-
tores de microondas, hlsers de unión p-n, termistores, multiplicadores análogos y pro-
badores para medición de éampo magnético que utlizan el efecto de Hall, refrigera-
dores termoeléctricos y generadores de potencia, así como varios tipos de módulos
de "circuitos integrados". Es de esperarse que los ejemplos que se han visto detalla-
damente en este capítulo, proporcionen los conocimientos suficientes del comporta-
miento de las uniones p-n y que las técnicas matemáticas incluidas, que se requieren
para el análisis de los dispositivos semiconductores, le permitan al lector proceder inde-
pendientemente en el estudio de otras obras. En la lista de referencias que aparece al fmal
de este capítulo se podrán encontrar mayores detalles relacionados con los dispositivos
que se vieron aquí, así como material relacionado con otros semiconductores.

EJERCICIOS
l. Verifique algebraicamente que las expresiones (15.1-15), (15.1-16) y (15.1-17) obtenidas
de los resultados anteriores, llenando los detalles formales de la derivación de estas ecuaciones.
2. Demuestre que la corriente de generación de huecos en una celda fotovoltaica p-n, tal
como la indica el primer término de la ecuación (15.1-17), es siempre positiva, sean cuales
fueren las magnitudes relativas de a, Lji 1 y d.
3. ¿A qué valor de voltaje de salida se obtiene la máxima salida de potencia de una celda
fotovoltaica p-n? ¿Cuál es el valor de la resistencia de circuito que se requiere para obtener esta
máxima potencia de salida?
4. En la unión p-n del fototransistor de la figura 15.5 se mantiene un voltaje de polariza-
ción inversa de - 100 V. Un electrón con una energía de 500 keV choca con la superficie
frontal del dispositivo y su energía se ve absorbida totalmente dentro de la región de carga
espacial asociada con la unión. Suponiendo que se disipan, en promedio, 3 eV de energía de la
partícula incidente por cada par electrón-hueco, y que todos los pares electrón-hueco se crean
instantáneamente, encuentre la magnitud del pulso de corriente que se observa en el circuito externo.
5. De acuerdo con la figura 15.2, resulta evidente que el máximo voltaje de circuito
abierto que se obtiene en una celda fotovoltaica p-n, es 1/Jo. Sin embargo, de acuerdo con la
ecuación (15.1-18), el voltaje de circuito abierto puede ser arbitrariamente grande, a condición
de que la intensidad de la luz (y, por ende, lg) sea lo suficientemente grande. ¿Cuál es la
explicación de esta paradoja aparente y cuál de los postulados es el correcto?
'·Un análisis de este tipo de dispositivo fue presentado por W. Shockley, Proc. I.R.E., 40,
1365 (1952).
8 Aunque es capaz de efectuar todas las funciones eléctricas normalmente asociadas con el triado
al vacío, el comportamiento del circuito del transistor con·{m de unión difiere cualitativamente del
tubo al vacío, debido a que depende de la presencia de dos especies de portadores, en lugar de uno.
Por tanto, a veces se conoce con el nombre de dispositivo bipolar.
Transistores de efecto de campo o unipolares 511

LECTURAS RECOMENDADAS
J. K. Jonscher, Principies of Semiconductor Device Operation, G. Bell and Sons, Ltd., Londres
(1960).
M. J. Morant, Introduction to Semiconductor Devices, Addison-Wesley Publishing Co., Reading,
Mass. (1964).
A. Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (1964).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
R. Wiesner, p-n Photoeffect, in Halbleiterprobleme, Friedrich Vieweg und Sohn, Braunschweig
(1956), Vol. III, pp. 56-71.
A. van der Ziel, Solid State Physical Electronics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (1957)
"Transistor Issues," Proc. inst. Radio Engrs., 30 (diciembre 1952) y 46 Gunio 1958).
CAPITUwl6
Contactos ~'~letal-semiconductor y
superficies de semiconductores

16.1 CONTACTOS METAL-SEMICONDUCTOR EN EQUILIBRIO

Cuando dos metales que tienen diferentes funciones de trabajo entran en con-
tacto, se produce un breve flujo de corriente transitoria que transmite electrones del
metal con la mayor energía de Fermi, al que tiene una energía de Fermi menor,
generando una diferencia de potencial de contacto en equilibrio entre ambos. Este
proceso se ilustra esquemáticamente en la figura 16.1. En (a), dos metales que
tienen diferentes funciones de trabajo, están separados por una distancia d, la cual se

-----
T
:-.;::
T
8</>z
8</>¡

Efecto
1
8</>z

túnel
d

•,z

(a)

1----:-
.! o""''""'
=
=
1
2
dol pote•d•
:le contacto =</>z -.¡.,
8</>¡ +

.,~~~~ ~~~~

(el
Figura 16.1. Etapas sucesivas para establecer el equilibrio entre dos metales con diferentes
funciones de trabajo.

513
514 Contactos metal-semiconductor y superficies de semiconductores

considera bastante grande, posiblemente del orden de un centímetro. En estas cir-


cunstancias, los niveles de Fermi de los dos metales no coinciden y el sistema no
está en equilibrio. Para lograr el equilibrio entre ambos metales, los electrones deben
formar un túnel a través de la barrera de potencial del metal que tiene la energía de
Fermi más alta al de energía más baja, hasta que se llegue a una condición de
equilibrio en que coincidan los dos niveles de Fermi. Esto no se puede lograr en
tanto que los metales estén muy separados, como sucede en (a), debido a que la
barrera de potencial es tan alta y tan gruesa que la posibilidad de formar un túnel
es casi nula. En estas condiciones, el equilibrio podría establecerse, sólo después del
trancurso de millones de afios.
Al irse acercando los dos metales, como se indica en (b ), el espesor de la
barrera de túnel se hace cada vez menor, hasta que la probabilidad de la formación
de túnel se hace suficientemente grande para permitir que los electrones penetren
por la barrera y fluyan de izquierda a derecha en el diagrama. La separación física
d, indispensable para producir esta situación, es unos cuantos múltiplos de la dis-
tancia interatómica. La corriente de electrones crea una carga negativa en el metal
de la derecha y el exceso de iones positivos que quedan detrás, a la izquierda, da
origen a una carga positiva en esa región. Así se establece un campo que eleva la
energía potencial de los electrones de la derecha con respecto a los de la izquierda,
hasta que coinciden los niveles de Fermi de los dos metales. En estas condiciones, el
sistema está en equilibrio y la corriente neta de túnel desciende a cero, ya que,
ahora, es igualmente probable el efecto de túnel en cualquiera de las dos direcciones.
Sin embargo, la transferencia de electrones que fluían de izquierda a derecha ha
establecido una diferencia de potencial de la magnitud cp 2 - cp 1 entre los dos meta-
les. Este voltaje se denomina diferencia de potencial de contacto entre los dos
metales. El número de electrones que se transfieren de un metal a otro, a fin de
establecer esta diferencia de potencial, es tan pequeño, en comparación con el nú-
mero total de electrones en las dos substancias, que los valores relativos de la
población de electrones libres no se ve en realidad afectada.
Se puede seguir la misma línea de razonamiento para inferir las propiedades de
un contacto metal-semiconductor. No obstante, el semiconductor difiere de una subs-
tancia metálica en que puede existir un campo eléctrico en el interior de un semi-
conductor. Por esta razón, la caída de potencial de contacto entre el metal y el
semiconductor puede producirse dentro del semiconductor, en lugar de hacerlo en la
interfaz de contacto. En el caso más simple posible, lo que puede suceder se ilustra
en la figura 16.2 para la situación de un contacto entre un metal y un cristal
semiconductor tipo n, en donde la función de trabajo del metal, <PM, es mayor que
la función de trabajo <Psc asociada con el semiconductor. Al igual que en la figu-
ra 16.1, se ve un proceso según el cual la distancia d entre las dos substancias se
reduce hasta que es lo bastante pequeña para permitir que los electrones formen un
túnel libremente, a través de la barrera. El campo que se crea, debido a la diferencia
de potencial de contacto existe ahora dentro del semiconductor, casi en su totalidad;
la energía de potencial de un electrón en reposo en la base de la banda de conduc-
ción del interior del cristal, difiere de la energía potencial de un electrón de este
tipo que se encuentra en la superficie, en la cantidad e(cpM- cp8c), y, como resul-
tado, los bordes de la banda de conducción y valencia cambian con respecto al nivel
de Fermi, tal y como se ilustra. La densidad de carga espacial positiva, dentro de la
región superficial, debida a la concentración en exceso en átomos donadores sobre la
población electrónica (en combinación con los electrones que formaron un túnel a
través del metal) es tal que produce un campo que basta para conservar la diferencia
de potencial <PM - <Psc entre los dos materiales. La situación dentro del semiconduc-
tor no es esencialmente diferente de la que se vio en relación con las capas de carga
espacial de una unión p-n.
Contactos metal-semiconductor en equilibrio 515

------
T
T e.¡, ••

-=--=:k-
- -
-
- -
-
_,.

--.....1.--iEfM

~-------d--------~

Ev + + ++ + +

(a)

__..1-- Región desértica


1 (carga espacial
Se forma una región 1 positiva)
de carga espacial 1
--- - -- -
1
1
--Ce
---l<fM

•rf---------

(b) (e)

Figura 16.2. Etapas sucesivas para establecer el equilibrio entre un semiconductor tipo n Y un
metal que tiene una función de trabajo mayor.

En este ejemplo, la densidad neta de portadores cerca de la superficie del


semiconductor se reduce de su valor de equilibrio volumétrico y la capa superficial
se denomina región de deficiencia. Si <f>M -1/>sc es lo bastante grande, las bandas
pueden cambiarse con respecto al nivel de Fermi, a tal grado que, cerca de la
superficie la banda de valencia está más próxima del nivel de Fermi que la de
conducción, y el material inmediatamente adyacente a la superficie se convierte en
tipo p. Se dice entonces que la superficie invierte su tipo de conductividad y la
superficie de la región tipo p se llama región de inversión.
Es importante observar que, en este ejemplo, se forma en la superficie una
barrera de potencial con una altura e(<f>M -1/>sc). La formación de esta barrera de
potencial y la existencia de la región de deficiencia son la base para explicar cómo
funciona un rectificador de contacto metal-semiconductor, como se verá más tarde.
Se debe observar que, en general, la región de deficiencia es muy gruesa. En reali-
dad, el espesor de la región de carga espacial de la superficie es prácticamente el
mismo que la de una unión p-n, que tiene una diferencia de potencial interno
<f>M -1/>sc· Por tanto, no existe la posibilidad (excepto en circunstancias extremas)
de que los electrones puedan establecer un túnel a través de dicha barrera. Por otro
lado, se puede considerar que la barrera delgada, con un espesor d, como se ilustra
en las figuras 16.1(c), 16.2(c) y 16.3 es, finalmente, tan delgada que permite que
los electrones se desplacen libremente, formando un túnel a través de ella. Fn dos
516 Contactos metal-semiconductor y superficies de semiconductores

Carga espacial
1--+--+
1-positiva
.-1--- Región desértica
1 (tipo-n)
1
- 1
__ ¡--

Región de inversión
(tipo-p)

·~---+-··

Figura 16.3. Capa de inversión en la interfaz entre un metal y un semiconductor tipo n.

Se forma una
.------,región de carga
espacial negativa
J Región de acu-
e<#lsc mulación de n+ e(<#IM-+sc)
(Carga ,espacial negativa)
- - -1 - ----- -.-
~~~;_~~L--~

-d-
1-+:-----+.....--+:-- ••

(al (b)

Figura 16.4. Etapas sucesivas para establecer el equilibrio entre un semiconductor tipo n y un
metal que tiene una función de trabajo menor.

materiales que están unidos en contacto íntimo, d es cero y la única barrera que
permanece es la barrera de potencial superficial del semiconductor.
En la figura 16.4 se muestra la situación que se produce en la interfaz de
contacto entre un metal y un semiconductor tipo n, en donde t/Jsc es mayor que
tPM· En este caso, el semiconductor debe adquirir una carga negativa, el metal una
positiva y las bandas se desplazan hacia abajo en la superficie. Como resultado, en
lugar de tener una barrera de potencial, se forma una región de acumulación en la
que la concentración de electrones es mayor que la de los átomos donadores ioni-
zados. Fl exceso de concentración electrónica en la región de acumulación superficial
crea la carga espacial negativa necesaria para sostener la diferencia de potencial de
contacto entre las dos substancias. Los efectos de contacto que se originan entre los
metales y los semiconductores tipo p pueden verse más o menos en la misma forma
que los de los metales con los semiconductores tipo n. Por tanto, se puede demos-
trar que se forma una región de deficiencia o inversión, con la barrera de potencial
correspondiente, en la interfaz entre el semiconductor tipo p y un metal cuya
Rectificación por contacto metal-semiconductor S17

función de trabajo es menor que la del semiconductor, y se establece una capa de


acumulación entre el semiconductor tipo p y un metal que tiene una función de
trabajo mayor. La verificación de estas conclusiones queda como ejercicio para
el lector.

16.2 RECTIFICACION POR CONTACTO METAL-SEMICONDUCTOR

La barrera de potencial en una interfaz metal-semiconductor en donde está


presente una capa de deficiencia o inversión, se comporta como un rectificador, más
o menos en la misma forma en que lo hace una unión p-n en el interior de un
c.ristal semiconductor. Puesto que la concentración de portadores dentro de la región
de deficiencia es menor que la de otras partes del sistema, cualquier voltaje aplicado
externamente tenderá a aparecer principalmente en la capa de mayor resistividad. El
voltaje aplicado tenderá a aumentar o reducir la altura de la barrera efectiva, como
se indica en la figura 16.5 para el caso de un semiconductor tipo n y un metal con
una función de trabajo mayor. En (a), en estado de equilibrio, cierta fracción de los
electrones de la banda de conducción del semiconductor, tendrán la suficiente energía
para sobrepasar la barrera de potencial de la superficie. Estos electrones harán que fluya
hacia la izquierda una corriente electrónica J;;. También se tendrá un flujo hacia la
derecha del metal al semiconductor, compuesto de electrones Ji,, debido a la pequeña

.,~

+ ••
Metal Semiconductor

(a) Equilibrio
{tipo-n)

(b) Polarización inversa (V0<0)


---....,.+--··
4----f----Jn

+
- -
---..;;;,._,.;;;__;::,-___;-:;... ..
>:::-:::--....,..-~.,..-,..---
++ + ++ ++ + + + + + ••
Jp+---+-- '
Jp- Huecos inyectados
(e) Polarización directa (V0 >0)

Figuras 16.5. Diagramas de potencial que ilustran la operación de un contacto rectificador


metal-semiconductor: (a) en estado de equilibrio, (b) con polarización inversa y
(e) con polarización directa.
518 Contactos metal-semiconductor y superficies de semiconductores

fracción de electrones del metal que pueden sobrepasar la barrera. De acuerdo


con el principio del balance detallado, estos dos flujos deben ser iguales en mag-
nitud en estado de equilibrio; en estas circunstancias, no se tiene una corriente
neta de electrones. De la misma manera, se tienen dos flujos de huecos 1; y 1;. El
primero se compone de huecos que se generan en la superficie del semiconductor
(por electrones de la banda de valencia que ocupan estados electrónicos ocasional-
mente vacíos en la distribución electrónica del metal) y que tienen la suficiente
energía para sobrepasar la barrera de potencial y entrar al semiconductor. La se-
gunda consiste en huecos del interior del semiconductor que se difunden a la super-
ficie y desaparecen ahí al extraer un electrón de la distribución de Fermi del metal.
Nuevamente en equilibrio, estos dos flujos son iguales y opuestos y no se tiene un flujo
de corriente de huecos.
Cuando se aplica un voltaje externo al contacto, se crea la situación que se
ilustra en la figura 16.5(b) o (e). Evidentemente, los dos flujos Jr¡ y Jt están
regidos por el número de portadores presentes en el semiconductor, y que poseen la
suficiente energía para sobrepasar la barrera de potencial superficial que, cuando se
aplica un voltaje externo. tiene la altura, e(cp 0 - V0 ), en donde,

(16.2-1)

es la diferencia entre las funciones de trabaio. Este número es proporcional a


e-e(.Po- Vo)/kT Los otros dos flujos J¡; y J! sólo dependen, respectivamente, del
número de huecos térmicamente generados que haya en el interior del semiconduc-
tor, y de la cantidad de electrones del metal que viniendo desde la izquierda puedan
sobrepasar la barrera (en donde la altura de ésta es fija). Estos dos flujos son funciones
sólo de la temperatura y los parámetros del material de las dos substancias, e indepen-
dientes de la altura de la barrera e(cp 0 - V0 ). Por tanto, J;; y .r;
se puede expresar
en la siguiente forma:

(16.2-2)
y
J p+ = J pO e-e(t/>o-Vo)fkT ' (16.2-3)

en donde lno y lpo son constantes que expresan los flujos de electrones y hue-
cos de cualquier energía que sea, que inicialmente son incidentes en equilibrio
sobre la barrera superficial. Puesto que Jt, y JP deben ser iguales a - Jr¡ y - 1¡,
respectivamente, cuando no se aplica ningún voltaje, estos flujos se pueden repre-
sentar como
(16.2-4)

y
¡-
D
= -J e-et/>o/kT
DO
(16.2-5)

Entonces, los flujos totales de electrones y huecos son

(16.2-6)

y
J
P
= ¡+P + ¡-P = J pO e-etf>o/kT(eeVo/kT _ 1)
' (16.2-7)
Rectificación por contacto metal-semiconductor 519

en tanto que la densidad total de corriente eléctrica es, sencillamente,


1 = e(JP- Jn) = lo(eeYo/kT- 1), (16.2-8)

en donde

(16.2-9)

En consecuencia, el rectificador metal-semiconductor tiene la misma depen-


dencia corriente-voltaje que la unión p-n, excepto que la corriente de saturación es
distinta. Los grandes flujos de electrones y huecos, que se acercan a la barrera en
equilibrio de la derecha y la izquierda, respectivamente, se pueden expresar 1 como

(16.2-10)

J _ e~o/kT
Pi: _ PoC (16.2-11)
po¡- -4e'

en donde Ps se relaciona con la concentración de huecos en la banda de valencia en


la superficie metálica. Utilizando estos resultados, la corriente de saturacióa se puede
representar ahora en la forma siguiente

(16.2-12)

En la condición de polarización inversa, el flujo de corriente es pequeño,


aproximándose a 10 a voltajes inversos grandes, en comparación con kTje. En estas
circunstancias, la región de deficiencia aumenta de espesor, al incrementarse la polari-
zación inversa, como sucede también con la región de carga espacial de una unión
p-n. Los procesos físicos que controlan el espesor de la capa de deficiencia son
esencialmente los mismos en ambos casos. La corriente que fluye se compone casi
por completo de huecos "recolectados" del interior del semiconductor por medio de
los contactos y los pocos electrones del metal que logran sobrepasar la barrera desde
la izquierda en la figura 16.5(b). En la condición de polarización directa, la altura
de la barrera se reduce y el número de electrones de la banda de conducción que
pueden sobrepasar la barrera, es ahora mucho mayor que en equilibrio o en condi-
ciones de polarización inversa. También se produce un gran flujo de electrones del
semiconductor al metal. Además de este flujo de electrones, se observa un flujo de
huecos hacia el interior del semiconductor, debido a que ahora la barrera de poten-
cial para los huecos que se generan en la superficie se reduce también cuando los
electrones de la banda de valencia del semiconductor caen dentro de los estados
electrónicos vacíos de la distribución de Fermi del metal. Esto equivale sencillamente

1 Debe observarse al respecto, que no puede haber campos ni gradientes de concentración,


así como tampoco la generación y recombinación de electrones y huecos como tales, en el metal
y, por esta razón, la situación difiere en ciertos aspectos esenciales de la que se vio en la
sección 13.1 en conexión con la unión p-n. De igual manera, es correcto usar las expresiones
(16.2-10) y (16.2-11) sólo cuando la región de deficiencia es lo bastante delgada para que no se
produzca dentro de ella prácticamente ninguna difusión. Puesto que el espesor de la barrera
superficial es, por lo común, más o menos lo mismo que las trayectorias libres medias de
electrones y huecos, a veces no se puede satisfacer esta condición en la práctica.
520 Contoctos metal-semiconductor y superficies de semiconductores

a la inyección de portadores minoritarios que se debe al contacto metálico en la


condición de polarización directa.
Los cálculos anteriores se hicieron para el caso de un contacto entre un semi-
conductor tipo n y un metal, que tiene una función de trabajo mayor. El caso de
un semiconductor p y un metal que tiene una función de trabajo menor, se puede
efectuar prácticamente del mismo modo. Sin emb~, -en este caso, veremos que se
obtiene una rectificación en sentido directo cuando el semiconductor es positivo con
respecto al metal, que es justamente lo opuesto del resultado antes obtenido. En
estas condiciones, se inyectan electrones al semiconductor tipo p, cuando éste es
positivo con respecto al metal. La verificación de estos resultados queda asignada como
ejercicio. Debido a la ausencia de una barrera de potencial, no se obtiene una rectifica-
ción en un contacto en el que se forma una capa de acumulación. Por tanto, se obten-
drá un contacto esencialmente óhmico en la interfaz, en donde no hay barrera (es decir
tPM = tf>sd o en donde está presente una capa de acumulación. Los resultados antes
obtenidos sirven para verificar las observaciones sobre las propiedades de los rectifi-
cadores de puntas de contacto que se hicieron en relación con el estudio del expe-
rimento Haynes-Shockley en la sección 10.4.
Las predicciones de esta teoría de los contactos metal-semiconductor desafor-
tunadamente no están totalmente de acuerdo en todo con la experiencia. 2 En par-
ticular, estos cálculos indican que las propiedades de rectificación de los contactos
metal-semiconductor deben ser extremadamente sen!t.ibles a la diferencia de las fun-
ciones de trabajo entre uno y otro, mientras que se encontró que son casi inde-
pendientes de esta cantidad. Bardeen 3 explicó esta discrepancia en 1947, e introdujo
la idea de los estados de superficie en la interfaz del contacto. Este tema se estu-
diará en la siguiente sección. En otros aspectos, la teoría fue más útil ya que la
característica predicha de corriente-voltaje concuerda bastante bien con la experiencia
y, en particular, los efectos asociados con la inyección de electrones y huecos (como
se ilustra, por ejemplo, mediante el experimento de Haynes-Shockley) están total-
mente de acuerdo con las observaciones experimentales.

16.3 ESTADOS SUPERFICIALES Y RECTIFICACION INDEPENDIENTE


DE LAS FUNCIONES DE TRABAJO

De acuerdo con los resultados obtenidos de la seccwn anterior, las caracterís-


ticas de los contactos rectificadores metal-semiconductor deben depender básicamente
de la diferencia en las funciones de trabajo del semiconductor y el metal. En par-
ticular, si las funciones de trabajo de dos substancias son tales que producen una
capa de acumulación, no se podrá esperar la rectificación. Por el contrario, los
resultados experimentales de Meyerhof, 2 demostraron que, en el caso de los con-
tactos de silicio-metal, •las propiedades de rectificación del contacto son práctica-
mente independientes de la diferencia de las funciones de trabajo y, en realidad, era
más o menos lo mismo para todos los metales. Bardeen3 resolvió esta situación, al
suponer que podía haber estados electrónicos localizados asociados con la superfrcie
que quedaba dentro de la rel!ión de energía prohibida entre las bandas de conduc-
ción y valencia del semiconductor.
La justificación fundamental de-la existencia de estos estados de superficie se
relaciona con el trabajo de Tamm4 , quien demostró que, si un potencial periódico

2 Véase, por ejemplo, W. E. Meyerhof, Phys. Rev., 71, 727 (1947).


3 J. Bardeen, Phys. Rev., 71, 717 (1947).
4 l. Tamm, Physik. Z. Sowjetunion, 1, 733 (1932).
Estados superficioles y rectificación independiente S21

Barrera de superficie -x
Figura 16.6. La formación de los estados Tamm localizados dentro de la región de energía
prohibida en la superficie de un cristal unidimensional.

de pozo cuadrado, como el relacionado con el modelo de cristal de Kronig-Penney,


quedara cortado en un lado mediante una barrera de potencial superficial, como el
que se ilustra en la figura 16.6, se tendrían (además de las bandas de energía
permisibles acostumbradas del modelo de Kronig-Penney), niveles discretos permisi-
bles, dentro de las regiones de energía prohibida, correspondientes a las funciones de
onda que se localizan cerca de la superficie. Shockley 5 estudió más tarde y de
manera más detallada estos niveles de superficie. De acuerdo con los cálculos, debe
haber un estado de superficie por cada átomo superficial. Además de esto, se puede
esperar que se produzcan niveles de superficie localizados, con una distribución dis-
creta o continua, debido a los átomos de impurezas, capas de óxidos e imperfeccio-
nes estructurales en la superficie. Las propiedades superficiales de un cristal indivi-
dual dependerán de la densidad de estos niveles superficiales y su distribución de
energía.
La presencia de una densidad considerable de estados superficiales dará como
resultado una capa superficial de deficiencia o una capa de acumulación dentro del
semiconductor, incluso en ausencia de un contacto metálico externo. Para entender
cómo se llega a esto, se deberá examinar detalladamente un modelo específico que
se compone de un cristal semiconductor tipo n que tiene un número substancial de
estados superficiales de tipo receptor (que se cargan cuando están ocupados y son
neutros cuando están vacíos), cuya densidad y distribución de energía dentro de la
región prohibida se ilustra en la figura 16.7. En ausencia de cualquier contacto
metálico en la superficie, los estados superficiales se llenarán hasta el nivel de Fer-
mi6 creando una capa de carga negativa en la superficie, que repele los electrones
dentro de la banda de conducción del semiconductor, desde la superficie y que, por
tanto, deja una capa de carga espacial positiva superficial, debida a los iones dona-
dores no compensados. De esta manera, se establece una región de deficiencia y una
barrera de potencial superficial mediante el equilibrio entre el semiconductor volumé-
trico y los estados superficiales, de un modo muy independiente de cualquier con-
tacto externo. Si el cristal, tomado como un todo, es eléctricamente neutro, la carga
total contenida dentro de la región de carga espacial del semiconductor debe tener la
misma magnitud que la carga total asociada con los electrones en los estados super-
ficiales. Como se verá más tarde, este hecho permite calcular el valor del potencial
superficial <J>s dentro del semiconductor, en un punto adyacente a la superficie y, de
hecho, toda la distribución de potencial dentro de la capa superficial del semicon-

s W. Shocldey, Phys. Rev., 56, 317 (1939).


6 Por supuesto, esta proposición se relaciona con las condiciones que prevalencen al cero
absoluto. A temperaturas más altas, algunos estados anteriores a El estarán ocupados y algunos
estados inferiores estarán vacíos, de acuerdo con la ley de distribuc10n de Fermi.
522 Contactos metal-semiconductor y superficies de semiconductores

Densidad
del estado
superficial Región de carga -j
espacial positiva 1
1
1
1
1
1
-=.:.,;;-;:.-....-,.;;-;;.-....:-=---•c(X l
- - --------'¡...;-.,_.;;:---.-.:--..:=:..;-=-:-=--::....::-::.;..;--.::.-....
----------
Electrones en los
niveles superficiales ~-¡+-;---.+:.-----+:----:+---+-:- «r(x)
(carga superficial
negativa) Punto intrínseco -x

x•O

Figura 16.7. Formación de una capa superficial de inversión en una superficie libre de un
semiconductor a través de la interacción de los estados superficiales con el interior
del cristal.

ductor. Es evidente que si los estados superficiales son principalmente de tipo dona-
dor (cargados cuando están vacíos y neutros cuando están ocupados por electrones),
se formará una capa de acumulación y no una de deficiencia en un cristal tipo n.
Para comprender el efecto preciso de los estados superficiales; se verán ahora
los efectos que se producen cuando una substancia metálica se acerca a una región
superficial de semiconductor de este tipo. Se verá específicamente el caso en que el
metal tiene una función de trabajo más pequeña que el semiconductor tipo n, en
donde la capa de acumulación rectificadora se formó en ausencia de estados super-
ficiales. Esta situación se ilustra en la figura 16.8. En (a), la distancia d entre el
metal y el semiconductor disminuyó hasta el punto en que se establece un túnel de
electrones. Ahora, los electrones forman un túnel del metal a los estados super-
ficiales, y si la densidad de los niveles superficiales es lo suficientemente grande,
tales estados alojarán a todos los electrones que sean necesarios para establecer un
campo eléc... rico lo suficientemente grande para igualar las energías de potenciales de
los electrones en los niveles de Fermi respectivos y el estado final del sistema se
encuentra en (b). La situación dentro del semiconductor es esencialmente la misma
que en (a), excepto que el nivel de Fermi está un poco más alto con respecto a la
distribución de estados de superficie, y esto da como resultado un cambio en la
altura de la barrera superficial 81/J que, no obstante, puede ser muy pequeña, si la den-
sidad de eSi.~os de superficie es apreciable. La capa de deficiencia y la barrera
de potencial superficial permanecen todavía, y las propiedades de rectificación del
contacto que están gobernadas sobre todo por estas mismas características, son prác-
ticamente inalterables. Es fácil verificar que, dada una situación igual, excepto que la
función de trabajo del metal sobrepasa a la del semiconductor, el cambio de altura
de la barrera 81/J es de signo opuesto y el efecto túnel de los estados superficiales al
metal reduce el nivel de Fermi con respecto a la distribución de estados superfi-
ciales. 7 También en este caso las propiedades de rectificación quedan prácticamente

7 Si todos los estados de superficie tienen la misma energía tes decir, si su distribución es
esencialmente una función 1>), no habrá ningún cambio en absoluto en la altura de la barrera.
Estados superficiales y rectificación independiente 523

Efecto túnel
hacia los
estados
superficiales

1 - - - - d----1 ~+:----+.,... ••

(a) (b)

Figura 16.8. Diagrama que ilustra las etapas sucesivas para establecer el equilibrio entre un
metal y un semiconductor con estados superficiales. Si la densidad de estados
superficiales es bastantes grande, la distribución de carga espacial interna apenas se
verá afectada.

sin cambio. Por tanto, las características de rectificación son prácticamente inde-
pendientes de los valores relativos de las dos funciones de trabajo, lo cual concuerda
con lo que se observa en la práctica.
Otra demostración experimental de la existencia de los estados superficiales se
encuentra en el llamado experimento de efecto de campo, en el que se hace que un
semiconductor funcione como una de las placas de un condensador de placa paralela,
como se indica en la figura 16.9. En este dibujo se utiliza una muestra de germanio
tipo n, como placa de condensador negativo y se induce una carga superficial nega-
tiva tan grande como sea posible, conectando una fuente de alto voltaje entre las
placas. Puesto que la capacitancia de un condensador de placa paralela es A/4rrr, en
donde A es el área de las placas y r su separación, se inducirá una carga de
magnitud

V0 A
q =CV0 = - (16.3-1)
4nr

+ ~r---------------------,1

a~~oenvtoeltdaeJ·e -= +Vo~~~~~~~-L
+++++++++++++,+++++++++++ r
E0 = l{¡¡d
o -----n--G;--- !"---- -- -,-
~~ +
Fuente de h Potenciómetro
corriente J=<rE)
-::!::-

Figura 16.9. Diagrama esquemático del experimento de efecto de campo y circuitos asociados.
524 Contactos metol·semiconductor y superficies de semiconductores

en el semiconductor, cuando se aplica una diferencia de potencial V 0 • Si no hubiera


estados superficiales, esta carga se compondría sólo de electrones libres móviles den-
tro de la banda de conducción en la superficie. El número de portadores de carga
inducidos, AN es sencillamente qje, o bien,

V0 A (16.3-2)
AN=-.
4n:er

Este cambio en el número de electrones libres móviles produciría un cambio


en la conductividad de muestra t:.a que equivale a

(16.3-3)

en donde V es el volumen de la muestra. Si el volumen V se escribe como el


producto del área A y el espesor de la muestra h y se substituye en (16.3-2) el
valor de AN, se obtiene finalmente

VoJ.l.n (16.3-4)
!la=--
4nhr

como el cambio en la conductividad medida de la muestra, debido a la presencia de


la carga superficial inducida. No obstante, cuando el experimento se realizó, se
descubrió que el cambio de conductividad observado era sólo un décimo del valor
predicho por esa expresión. 8 Bardeen interpretó el resultado del experimento, seña-
lando que esto indicaba que aproximadamente el 90 por ciento del exceso se trans-
fiere a los estados superficiales, en lugar de hacerlo a la banda de conducción del
semiconductor, y que los electrones de estos estados son inmóviles, en lugar de libres.

16.4 POTENCIAL, CAMPO Y CARGA EN LA CAPA


SUPERFICIAL DE UN SEMICONDUCTOR

A continuación se verán detalladamente los campos y los potenciales que se


establecen dentro de la región superficial cuando hay estados superficiales presentes.
En general, se supondrá que se tiene un campo aplicado E 0 fuera de la superficie
del semiconductor, que se genera mediante algún aparato experimental de efecto de
campo, como se demuestra en la figura 16.9. La situación dentro del cristal será
entonces la que se representa en la figura 16.7. Se observará que el origen de la
función de potencial cp(x), que se puede escoger de un modo arbitrario, se define
como el punto en donde el material es intrínseco (es decir, en donde p 0 = n 0 = n¡)c/J
es cero. Esta es la misma elección que se hizo en la exposición sobre la unión p-n
en la sección 12.3. En efecto, hay muchos puntos de similitud entre los dos ejem-
plos. En estas circunstancias, la variación de las energías de borde de la banda de
conducción y valencia, en función de la distancia, queda demostrada por ( 12.3-6) y
(12.3-7), en tanto que las densidades de portadores en cada punto, dentro de la

8 W. Shockley y G. L. Pearson, Phys. Rev., 74,: 223 (1948).


Potencial, campo y carga en la capa superficial de un semiconductor 525

banda, está representada por (12.3-4) y (12.3-5). Las densidades de portadores se


pueden expresar como sigue

(16.4-1)

(16.4-2)

Sin embargo, puesto que

Ue e -h.;-•tlfkT _
-
ni -
_U e-<•1 -•.;)/kT
v '

de acuerdo con (9.3-6) y (9.3-15), éstas se pueden escribir sencillamente como

(16.4-3)

(16.4-4)

Si se supone que todos los donadores y receptores están ionizados, la ecuación


de Poisson toma la forma

= 4nen 1 (zsenh ecf>(x) _ Nd- Na). (16.4-5)


" kT n1
Por supuesto, aquí se supone que la simetría del sistema es tal que el poten-
cial varía sólo a lo largo de la dirección x. Si la superficie es un plano y si la
muestra es uniforme, esta condición se puede lograr en la práctica. Si ahora el
potencial se representa mediante una variable, sin dimensiones u, entonces

u(x) = ecf>(x)fkT, (16.4-6)

y (16.4-5) se convierte en

d2 u
-d2 = L-r 2 (senh u(x) - Nd-
2n¡
Na) , (16.4-7)
X DI

en donde LDi es la longitud intrínseca de Debye y como la define (10.2-49). Esto


ie puede escribir en una forma que es incluso más sencilla, haciendo notar que, a
;ma gran distancia dentro del semiconductor, a valores muy grandes de x

lim n(x)
JC .. OO
= n0 = n1ee•s/kT =n e"1 8

por lo cual

no
u8 = ln-. (16.4-8)
n;
526 Contactos metal-semiconductor y superficies de semiconductores

En este caso lf>B (y, por ende uB) se relaciona con el potencial electrostático
que queda en lo más profundo del cristal, como se indica en la figura 16.7. Expre-
sando la cantidad uB = 1n(n 0 /n;) en función de Nd -Na por medio de (9.5-23), y
recordando que 1n(x +v'1 +x 2 ) = senh - l x, (16.4-7) se puede expresar como

d2 u 2
- 2 = - 2- (senh u- senh u 8 ). (16.4-9)
dx LD,
También debe observarse que, puesto que n0 p 0 = nl,
n0 n; Po
u 8 = In - = In - = -In - . (16.4-10)
n; Po n;
Se puede integrar una vez (16.4-9), haciendo que

du e dt/J eE
F= - - = - - - = - - - (16.4-11)
dx kT dx kT

en donde E(x) =- dlf>/dx es el campo eléctrico. Por tanto

d 2u dF dF du dF
-= --= ---=F- (16.4-12)
dx2 dx du dx du ·

Si se substituye esto en (16.4-9) y se integra desde F =O (correspondiendo a


x = ""• muy adentro, en donde el campo desaparece claramente), hasta un punto
interior arbitrario, se puede obtener la relación

F = - -du = - 2 J cosh u - cosh u 8 - (u - u 8 ) senh u 8 , (16.4-13)


dx LDI

que conecta el valor del campo en cualquier punto al valor del potencial. Esto se
puede integrar una vez más, en esta ocasión, entre los límites x =O (correspon-
diendo a la superficie, en donde u= u8 = elf>s/kT) y un punto interior arbitrario, lo
cual da

LDifu du (16.4-14)
x= - T usJcosh u- cosh u 8 - (u- u 8 ) senh Us

La relación entre el campo y el potencial, dentro de la capa de carga espacial


inmediata a la superficie, se puede obtener, substituyendo u= u8 en (16.4-13), para
mostrar

F =-(du) =-eEs=.2_Jcos u - cos u 8 -(u -u 8 ) senu 8 •


s dx s kT LDI s s
(16.4-15)

Desafortunadamente, por lo general no puede integrarse en general en forma


cerrada la ecuación (16.4-14), a fin de dar una relación explícita que describa a u
en función de x. No obstante, existe un caso en que se puede obtener una solución
analítica exacta, correspondiente a un material en el que Nd- Na= O, de donde,
Potencial, campo y carga en la capa superficial de un semiconductor 527

n 0 = n¡ y uB = O. En consecuencia, el cristal semiconductor volumétrico es intrín-


seco en sus profundidades y esa situación particular se denomina caso de volumen
intrínseco. Dado que uB =O en (16.4-13), se p1.1ede demostrar fácilmente que, para
este caso particular

du 2J2
F = - - = --senh-.
u
(16.4-16)
dx L 01 2

esto se puede integrar ahora como se indicó antes, en donde la ecuación resultante
como solución para u sea

-x../2
- Us )
u(x)=4tanh- 1 ( e L 01 tanh-¡. (16.4-17)

Evidentemente, la relación entre el campo y el potencial dentro de la capa de


carga espacial en la superficie del cristal es, para este ejemplo

eE5 2j2 5 u
Fs =- - = - - senh-. (16.4-18)
kT LDi 2

Los campos superficiales se pueden relacionar con la densidad de carga de los


estados de superficie, la carga espacial por unidad de área superficial y un campo
externo E 0 , que se puede considerar que se aplica como se ilustra en la figura 16.9,
aplicando el teorema de flujo eléctrico de Gauss a volúmenes cilíndricos cuyos ejes
son normales a la superficie del semiconductor, como se indica en la figura 16.10.
Considerando primero la superficie gaussiana S 1 que se encuentra en la parte su-
perior del diagrama, el teorema de Gauss 9 requiere que

Js,j D • n da = 4nq (16.4-19)

en donde D es el vector de desplazamiento eléctrico y n es la normal hacia afuera.


Es obvio que en las superficies laterales del volumen cilíndrico, n y D son mutu~t­
mente perpendiculares y el producto escalar desaparece. En los otros extremos del
cilindro, se obtiene

(16.4-20)

en donde A 1 es el área del extremo de la superficie cilíndrica y ~s es la densidad


de carga por unidad de área en los estados de superficie. Puesto que puede supo-
nerse que la altura del cilindro es infinitesimalmente pequeña, se puede hacer caso
omiso de la cantidad de carga dentro de la superficie que produce la parte de la
carga espacial del volumen interior que se incluye ahí. Puesto que D 0 = E 0 y Ds =
KEs, el resultado se puede expresar como sigue

(16.4-21)

9 Véase, por ejemplo, J. R. Reitz y F. J. Milford, Foundations o[ Electromagnetic Theory,


Addison Wesley Publislting Co., Reading, Mass. (1960), p. 77.
S28 Contoctos metal-semiconductor y superficies de semiconductores

t---HlBOI~tn de carga espacial----i


Gaussiana St 1

1
Densidad de carga espacial ~a 1
por unidad de área en los
Eo ~os wperficiales
E, 1

Do o, Gaussiana s2

Carga l:¡ por unidad de área


de superficie en la región
interior de la carga espacial

Superficie

Figura 16.10. Diagrama que ilustra la construcción de las superficies gaussianas y las notaciones
usadas para los cálculos de la sección 16.4.

Ahora, el teorema de Gauss se puede aplicar del mismo modo a la superficie


S2 ; puesto que el campo que está en lo más profundo desaparece, el resultado será
(16.4-22)

en donde ~¡
es la carga por unidad de área superficial en la región de carga espacial
interior y ~trepresenta la carga total por unidad de área superficial. Al substituir el
valor dado por (16.4-21) en lugar de ~s en (16.4-22), se ve claramente que la
relación entre la intensidad del campo interior ~s en la superficie y la densidad
total de carga espacial interior ~¡ es

(16.4-23)

Si se conoce la densidad y la distribución de estados superficiales y si se da el


campo E0 aplicado externamente, se puede calcular el valor del potencial de super-
ficie us. Una vez que esto se conoce, y las condiciones de frontera del potencial
interior se establecen, este potencial y el campo, así como la densidad de carga
espacial interior, se pueden determinar con claridad. Para ilustrar mejor esto, se verá
el caso del volumen intrínseco en donde se tienen Ns estados superficiales de tipo
receptor por unidad de área superficial, en donde todos tienen una energía es.
Entonces, la densidad de estados de superficie (cm- 2 ) se puede representar como

(16.4-24)
Potencio/, campo y carga en la capa superficiol de un semiconductor 529

El nivel de energía asociado con los estados de superficie se localiza en un


valor fijo con respecto a los bordes de la banda de conducción y valencia en la
superficie. Puesto que esto último varía de acuerdo con el valor del potencial de su-
perficie, lo mismo sucede con la energía de los estados de superficie es; en realidad,
haciendo referencia a la f¡gura 16.11, es evidente que

(16.4-25)

en donde Eso es la diferencia de energía entre el nivel superficial y el punto


intrínseco dentro de la banda prohibida. Por tanto, puesto que en el caso volumé-
trico intrínseco e¡= O, se puede escribir ns, que es el número de electrones en los
estados de superficie por unidad de área superficial

ns = f.•·fo(e)gs(e) de= Ns f.'" c5(e-1 +(eso-


le le
er/Js
e<• t¡)/kT
0 )) Ns
de= 1 + e<•so e•s>Jir.T ·
(16.4-26)

La densidad de carga superficial Ls es entonces

(16.4-27)

y, de acuerdo con (16.4-21) y (16.4-18), se puede escribir una ecuación para el


campo superficial interno Es en la forma

E _ 4_7t_L_s + E 0 _ -4neNs ___1-=,..---- + E 0 = 2j2kT senh Us.


S - K K - K 1 + e•so/kT e us K eL01 2
(16.4-28)

de donde, [recordando (10.2-29)];

1 = ~ _ 2Jln1L 01 senh u5 (16.4-29)


1 + e-so/lr.Te-us 4neNs Ns 2.

Distribución de
estados en la
superficie

-x
--:::.---:-.---:.:-----:-+---.-=--- ••(x)
x=O
Superficie

Figura 16.11. Diagrama de potencial y notación utilizada para el cálculo del potencial super-
ficial como función del campo aplicado, que se vio en la sección 16.4.
530 Contactos metal-semiconductor y superficies de semiconductores

f(u,)
'( ) - Eo
u,----
4.,.eN,
2./2n L
Ns
1 01
sen h -u,2

-1

Figura 16.12. Diagrama que ilustra la solución gráfica de la ecuación (16.4-29) y la variación del
potencial superficial en función del campo aplicado y otras variables.

En principio, esta ecuación se puede resolver para us, con el fm de detenninar


el potencial de superficie. No obstante, las dificultades algebraicas para llegar a una
solución analítica son tan grandes 10 que para los fines presentes, una solución grá-
fica como la que se ilustra en la figura 16.12, nos proporcionará más datos.
En esta figura, las expresiones que aparecen al lado izquierdo de (16.4-29) y
las del lado derecho de dicha ecuación, aparecen graficadas por separado, como
funciones de Us. En la intersección de las dos curvas, las funciones son iguales y la
coordenada Us de dicho punto representa la raíz verdadera de (16.4-29). La varia·
ción del valor de us en función del campo aplicado, se puede estudiar. observando
que, confonne varía E 0 , la curva senh se traslada hacia arriba o hacia abajo, en
fonna paralela al eje f(us). Para E 0 =O, us es invariablemente negativa, correspon-
diendo a un valor positivo para - eif>s. Esto es de esperarse, ya que los electrones de
los estados superficiales crean una capa de carga espacial superficial positiva y, por
ende, una región queda con una deficiencia de electrones, como se indica en la
figura 16.11, lo cual conduce a un valor positivo para - eif>s· Con las densidades de
estado superficial que generalmente se asocian con las superficies de gennanio y
silicio, se encuentra que la energía potencial de superficie, puede variarse a lo largo
de diversas unidades kT a ambos lados del valor de campo cero, mediante la aplica-
ción de valores de E 0 que puegan alcanzarse experimentalmente, dentro de un expe-
rimento de efecto de campo como el que se ilustra en la figura 16.9. Una vez que
se detennina Us en función de las cantidades conocidas N s, eso y E 0 mediante este
método, la fonna precisa del potencial interior se sigue de (16.4-17), el campo
interno Es en la superficie se sigue de ( 16.4-28) y la densidad de carga de los
estados superficiales de (16.4-27) y la densidad de carga interior de (16.4-23). Se
puede usar el mismo planteamiento con otras muestras de volumen intrínseco, aunque
las operaciones matemáticas son IJ\UCho más complejas.
Desafortunadamente, en la práctica casi siempre se desearía invertir este proce-
dimiento, comenzando con valores experimentales de la densidad de carga super-
lO Si se substituye x =e·•s en (16.4-29), se puede demostrar que esta ecuación se
reduce a una ecuación cúbica en x, que cuenta sólo con una raíz real.
Conductividad duperficial 531

ficial e interior, en función del campo aplicado, derivando los valores correspondien-
tes de Es y u8 en función del campo, e infiriendo de estos datos, la densidad de
los estados de superficie y su distribución de energía. Este problema es mucho más
difícil y la respuesta se puede obtener casi siempre probando varios modelos con
estados de superficie supuestos modificándolos conforme sea necesario para obtener
un ajuste satisfactorio de los datos experimentales, cuando se efectúe el cálculo antes
descrito. Algunas de las sutilezas incluidas en estas mediciones de efecto de campo y
las cohclusibnes que deben obtenerse de los resultados experimentales, se analizarán
en la siguiente sección.

16.5 CONDUCTIVIDAD SUPERFICIAL, EFECTO DE CAMPO


Y MOVILIDAD SUPERFICIAL; PROPIEDADES
DE SUPERFICIES DE SEMICONDUCTORES REALES

En el experimento de efecto de campo de la figura 16.9, la conductancia de


superficie que se origina, debido a un incremento o una disminución de la densidad
de portadores dentro de la región de carga espacial, se puede medir como una
función del campo aplicado. El total de la densidad de carga inducida ~t• puede
inferirse de (16.3-1) como V0 /(41Tr). De acuerdo con estos datos, se puede calcular
la variación del potencial de superficie con el campo aplicado y, por tanto (utilizan-
do los procedimientos delineados en la sección anterior), obtener información res-
pecto a la densidad y la distribución de energía de los estados superficiales.
Si se usa nuevamente el caso de volumen intrínseco como ejemplo, es evidente
que si t/Js es cero, no se tendrá una capa de carga espacial de superficie y el valor
volumétrico de conductividad prevalecerá incluso en la región superficial. Si t/Js es
positivo (y, por ende, - et/Js es negativo), las bandas que se ilustran en la figu-
ra 16.11 se doblarán hacia abajo, cerca de !a superficie y los electrones que se
generan térmicamente en el interior se deslizarán por la barrera de energía poten-
cial y se acumularán cerca de la superficie, en tanto que la región superficial repe-
lerá a los huecos. En efecto, la superficie será tipo n. La concentración de electrones
cerca de la superficie, como función de t/J, está dada por (16.4-3) y la concentración
de huecos por (16.4-4). Es evidente que si t/Js es bastante grande, la concentración super-
ficial de electrones puede ser varios múltiplos del valor que tiene en la parte volumétrica
y, por tanto, la conductividad eléctrica de la capa superficial sera mayor que en la parte
volumétrica. En consecuencia, se produce un aumento en la conductancia de la
muestra. De la misma manera, si t/Js es negativo, las bandas se doblarán hacia arriba
y la • acumulación resultante de huecos en la superficie puede originar una conducti-
vidad en la capa superficial que es mucho mayor que el valor volumétrico. Aparente-
mente, la conductancia de la muestra llegará a un valor mínimoll cerca de t/Js =O
y aumentará conforme t/Js se desvíe de ese valor en cualquier dirección. Los valores
exactos de tP(x) y por ende n(x) y p(x), así como la conductividad, se pueden
calcular como funciones de t/Js utilizando los métodos delineados en la sección 16.4
y, por tanto, se puede construir una gráfica exacta de la conductancia de muestra en
función de t/Js (o en [unción de ~¡, que se relaciona con t/Js a través de (16.4-23) y
(16.4-18)). Al hacer estos cálculos, se debe reconocer que los portadores dentro de
la capa superficial están sujetos a un proceso de dispersión que no afecta a los
portadores de la sección volumétrica, es decir, la dispersión de superficie. El efecto

11 El mínimo no se encuentra exactamente en el punto t/Js = O, debido a que las movili-


dades de electrones y huecos no son iguales.
532 Contactos metal-semiconductor y superficies de semiconductores

de la dispersión de superficie dentro de las capas de carga espacial fue analizado por
Schrieffer 12 , que adoptó el modelo simple de potencial lineal para hacer la aproxi-
mación de: verdadero potencial de superficie. Se encontró que la movilidad super-
ficial se reducía del valor volumétrico en un factor que dependía del potencial
superficial. En el germanio puro, este factor varía de la unidad correspondiente a
cf>s = O a aproximadamente 0.4 para los valores mayores de cf>s que pueden r 1 can-
zarse experimentalmente. El valor del factor depende también, en parte, de la den-
sidad volumétrica de portadores. 13
En la figura 16.13 se presenta esta gráfica para una muestra de germanio casi
intrínseca.1 4 En el mismo diagrama-se grafica el valor experimentalmente determi-
nado del cambio de conductancia como función de la carga total inducida l:¡.
Primero se verá un valor particular observado del cambio de conductancia. Los
valores correspondientes de l: 1 y l:¡ se pueden leer en las curvas y, puesto que el
cambio de conductancia se produce debido casi totalmente a la región de carga
espacial, el valor de cf>s en la curva computada correspondiente a este valor del
cambio de conductancia es el valor real del potencial de superficie. La distancia

i:lc (J.unho
por cuadro)
10~----r----.,----.-----.-----.----~----------~----~----·

Ge, tipo-p
40 ohm-cm (300"K)

-lO -8 -6 -4 6 8 lO X 10 9
I; or I, (Couls 1 cmZ)

Figura 16.13. Valores observado y computado de la carg~ superficial, en función del potencial de
superficie y el campo aplicado. (Según W. L. Brown, W. H. Brattain, C. G. B. Garrett Y
H. C. Montgomery en Semiconductor Surface Physics, R. H. Kingston, Editor,
University of Pennsylvania Press, 'Filade.lf"Ia [1957], p. 115.)

12 J. R. Schrieffer, en Semiconductor Surface Physics (R. H. Kingston, Red.) University of


Pennsylvania Press, Filadelfia (1957), p. 55.
13 Esto se puede entender, recordando que en las muestras en donde la concentración de
impurezas en el volumen es grande, el espesor de la región de carga espacial superficial es
pequeño y viceversa. En cristales relativamente puros, el espesor de la capa de carga espacial
superficial será casi siempre mucho mayor que la trayectoria libre media para la dispersión
dentro de esta región, y el efecto del metanismo de dispersión superficial en la conductancia
total de la capa superficial será insignificante. Al aumentar la densidad de impurezas, el espesor
tot¡¡], de la región de carga espacial puede hacerse del orden de la trayectoria libre media o
menor. En tales circunstancias, la contribución de la dispersión superficial a la movilidad general
asociada con la conductancia de la capa superficial puede ser muy importante.
14 Este ejemplo en particular fue examinado por W. L. Brown, W. H. Brattain, C. G. B.
Garrett y H. C. Montgomery en Semiconductor Surface Physics (R. H. Kingston, redactor), Uni-
versity of Pennsylvania Press, Filadelfia (1957), p. 115.
Conductividad superficial 533

horizontal entre las dos curvas corresponde a la densidad de carga de los estados
superficiales. La variación de c/Js con la densidad de carga de los estados superficiales
~s se puede obtener en forma directa, y se puede buscar un modelo de estados
superficiales que produzca esta variación observada.
Se ha encontrado experimentalmente que el ambiente gaseoso en que se sumer-
ge la muestra, tiene un efecto profundo en la estructura de los estados superficiales.
En efecto, se puede hacer que en el campo cero el valor del potencial de superficie
varíe a lo largo de una gama amplia, cambiando simplemente la naturaleza de la
atmósfera que rodea a la muestra. Por ejemplo, se ha encontrado 12 que la presencia
del ozono en el ambiente gaseoso produce, en el caso del germanio, un gran valor
negativo de c/Js y, por ende, una superficie de un fuerte tipo p en tanto que un ambiente
de aire húmedo produce un gran valor positivo de c/Js y, por tanto, una superficie
de un fuerte tipo n.
Otro fenómeno que se aprecia con claridad es el relajamiento lento del efecto
de campo. Cuando se aplica un voltaje en el experimento que se ilustra en la
figura 16.9, se observa inmediatamente un cambio en el potencial de superficie y
una variación en la densidad de carga espacial interna; pero el potencial de superficie
decae en forma gradual (durante un periodo que, dependiendo de la superficie y la
temperatura, varía de segundos a horas o días), hasta llegar a un valor muy aproxi-
mado al de campo cero. Este efecto se ha explicado, suponiendo que existen dos
clases distintas de estados superficiales, un grupo de estados ''rápidos" que interac-
túan con gran rapidez con la región de carga espacial interna y un grupo de estados
"lentos", que pueden interactuar sólo con gran lentitud con el interior del cristal.
Por lo general, se considera que los estados rápidos residen en la superficie del
cristal semiconductor, en tanto que los lentos se asocian con la superficie externa de
la capa de óxido que, por lo general, se encuentra presente en las muestras de
germanio o silicio. Este punto de vista de la situación se ve respaldado porque el
tiempo de relajación para los efectos de campo se hace muy grande, cuando están
presentes gruesas capas de óxido. La magnitud de los efectos de campo ''rápidos"
observados y el hecho de que el potencial superficial se relaja casi siempre hasta un
valor no muy distinto del de campo cero, después de un nempo prolongado, sugiere
que la densidad de los estados rápidos del germanio es típicamente del orden de
10 10 ó 10 12 cm-2, en tanto que la densidad de los estados lentos es mucho
mayor, quizá del orden de casi 10 15 cm-2. Se considera que los efectos asociados
con los cambios en el ambiente gaseoso, se relacionan principalmente con los estados
de superficie lentos, dejando a los rápidos casi sin ningún efecto. El hecho de que la
densidad observada de los. estados de superficie rápidos es mucho menor que el valor
que predicen las teorías de Tamm y Shockley, nos llevan a la conclusión de que los
estados rápidos no pueden identificarse con los estados Tamm, por lo menos en la
forma simple en que se representan en estas investigaciones teóricas.
También es evidente, de acuerdo con los resultados precedentes, que los esta-
dos de superficie y la distribución de potencial superficial deben ser los principales
causantes de la determinación de la probabilidad de recombinación para portadores
en exceso incidentes en la superficie y, por ende, para el establecimiento del coefi-
ciente de reflexión superficial y la velocidad de recombinación superficial. Sobre
todo, se puede ver claramente que los valores medidos del coeficiente de reflexión
superficial no representan el coeficiente de reflexión "real" de la superficie, sino que
expresan el efecto combinado de la superficie propiamente dicha y la región de carga
espacial correspondiente en la recombinación de los portadores en exceso, dentro de
la región superficial. Por tanto, es de esperarse que la velocidad de recombinación
superficial se vea afectada por cualquier cosa (por ejemplo, campos aplicados, tem-
peraturas, ambiente gaseoso) que puedan alterar el potencial superficial al igual
que cualquier factor que pueda modificar la densidad y la distribución de los ni-
534 Contactos metol~emiconductor y superficies de semiconductores

veles superficiales mismos. Steveson y Keyes 15 emprendieron un análisis detallado


de la recombinación superficial, basándose en la teoría de recombinación de Shockley-
Read. Esta teoría presupone que los estados superficiales pueden actuar como
tr¡unpas Shockley-Read y predice una relación entre la velocidad de recombina-
ción superficial y el potencial superficial que, en general, está de acuerdo con los
resultados de mediciones experimentales. los resultados parecen indicar que son los
estados superficiales rápidos y no los lentos los que tienen una importancia primor-
dial para determinar la velocidad de recombinación superficial.

EJEROCIOS
l. Utilice la línea de razonamiento desarrollada en la sección 16.1, para analizar detallada-
mente la naturaleza del contacto ideal en el que no se comprenden estados superficiales entre un
metal y un semiconductor tipo p.
2. Derive la relación corriente-voltaje para un contacto rectificador entre un metal y un
semiconductor tipo p (t/>sc>tf>M>· Suponga que no existen estados de superficie.
3. Examine la naturaleza de la capa de carga espacial superficial que se forma cuando los
estados superficiales de tipo donador (neutros cuando están ocupados por electrones y positiva-
mente cargados cuando están vacíos), estlÍJI presentes en la superficie de un semiconductor.
4. Demuestre explícitamente, utilizando el planteamiento adoptado en la sección 16.3, que
las propiedades rectificadoras de un contacto metal-semiconductor tJ>M >tf>sc son prácticamente
<
iguales a las que se observen cuando tf>M tf>sc siempre que esté presente en la superficie del
semiconductor una distribución de estados superficiales originada por una capa de deficiencia.
S. Compute el porcentaje de cambio de conductividad que deba esperarse, si no hay estados
superficiales presentes, cuando se aplica una diferencia de potencial de 1000 V a una distancia
de 0.1 mm, a una muestra de germanio tipo n que contiene 10 14 electrones por cm 3 en
equilibrio, que tiene un espesor de 0.1 mm.
6. Reproduzca los aspectos matemáticos de la derivación del campo eléctrico, el potencial
y la densidad de carga espacial interna integrada, relacionados con el caso del volumen intrín-
seco.

LECTURAS RECOMENDADAS
W. H. Brattain y J. Bardeen, "Surface Properties of Germanium," Bell Syst. Tech. J, 32 1
(19S3).
D. R. Frankl, Electrical Properties of Semiconductor Surfaces, Pergamon Press, Londres (por
publicarse, 1966).
R. H. Kingston (editor), Semiconductor Surface Physics, University of Pennsylvania Press, Fila-
deliJa (19S7).
R. H. Kingston, "Review of Germanium Surface Phenomena," J. Appl. Phys., 21, 101 (1956).
C. G. B. Garrett y W. H. Brattain, "Physical Theory of Semiconductor Surfaces," Phys. Rev., 99,
376 (19S5).
T. B. Watkins, The Electrical Properties of Semiconductor Surfaces, en Progress in Semicon·
ductors, Heywood and Co., Londres (1960), Vol. S, p. 7.
J. N. Zemel (editor), Semiconductor Surfaces, Pergamon Press, Londres (1960).

15 D. T. Stevenson y J. R. Keyes, Physica, 20, 1941 (1954).


APENDICE A
La función 8 Dirac
Se puede considerar que la función 8 Dirac tiene las siguientes propiedades:

b(x- x 0 ) =O, (x =1= x 0) (Al)

y
(A2)

en donde e 1 , e2 son cualesquiera números positivos que puedan ser arbitrariamente


pequeños (pero en realidad no lo son). Evidentemente, puesto que, de acuerdo con
(Al)8(x-x 0 ) es cero en todas partes, excepto en X=X 0 , para que (A2) sea ver-
dad, la función debe ·ser infmita en x = x 0 • La función 8 Dirac se puede considerar
entonces como una función 1 "pico" como la que se ilustra en la figura Al.

f(x)= 8(x-x0 )

-+----..u------x
O Xo

Figura Al. Representación visual aproximada de la función 8 Dirac 8(x- xo) como un "pico"
de altura infinita en el punto x =X o.

La propiedad matemática más importante de la función 8 Dirac se expresa


mediante la ecuación

(A3)

1 Estrictamente hablando, la función 8 no satisface los requisitos matemáticos rigurosos


que definen una función y, en el sentido estricto de la palabra, no se trata de una función en
absoluto. Sin embargo, se puede considerar como el límite de un conjunto de funciones que
tienen un área unitaria y que se hacen progresivamente más delgadas y más altas, alrededor de
un solo punto, x =X o. En efecto, las funciones (10.3-23) como x' =Xo, E o= O y t' =O forman
precisamente un conjunto de este tipo en el límite t-+ O. Este conjunto se ilustra (para el caso
en que X o= O) en la figura 10.7(a).

535
536 Apéndice A: La función 5 Dirac

en donde j(x) es una función de x que defmida en x = x 0 . Se puede llegar a este


resultado simple, observando que si la función 5 se multiplicara por una constante
A, entonces, de acuerdo con (A2) se podría escribir

f xo+•z

.xo-e:t
Ao(x - Xo) dx = A
f"o+12o(x -
xo-et
Xo) dx = A . (A4)

Si en lugar de ser una constante multiplicada por la función 5 el integrando se


da como una función, específica de x, multiplicada por la función 5, se puede
evaluar la integral, suponiendo inicialmente que e 1 y e2 son extremadamente pe-
queños. Entonces, si f(x) tiene un comportamiento adecuado en las cercanías de
x = x 0 , se puede considerar que la función j(x) tiene el valor constan te j(x 0 ) a lo
largo de un pequeño intervalo (x 0 - € 1 <x 0 <x 0 + e2 ), de donde

(AS)

Sin embargo, es claro que, en vista de (Al) y (A2), el valor de la integral es


independiente del valor que se escoja para e 1 y e 2 • Por tanto, el resultado (A3)
queda demostrado.
La función 5 Dirac se utilizará en este trabajo para evaluar ciertas integrales que se
presentan en conexión con la estadística de Fermi-Dirac de los sistemas de electrones
libres y para describir la función de la densidad de estados para sistemas que tienen niveles
discretos de energía que utilizan el procedimiento desarrollado en relación con sistemas
con una densidad casi continua de estados cuánticos. No obstante, se ha encontrado
que es útil en una variedad de situaciones que se presentan en otras ramas de la física
matemática.
APENDICE B
Análisis temorial
El tensor se puede considerar como el producto de una yuxtaposición lineal de
dos o más operaciones vectoriales. Por ejemplo, suponga que se busca el gradiente de
un vector. Se puede proceder aplicando el operador gradiente (ixa¡ax + iya¡ay +
izajaz) a un vector A. Se obtiene

VA = (1..,. axa + •,. aya + •z. aza)<·•..A"+ •,. A' + •z. Az)

(Bl)

Aparentemente, el gradiente de un vector tendrá nueve componentes de la


fonna aA,Jax,, (en donde a:= X, y, z x,
y =X, y,
z). Existen dos direcciones asocia-
das con cualquier componente de esta índole. En este ejemplo, la dirección en la
que se toma la componente del vector y la dirección en la que cambia, es lo que s~
está estudiando. Las entidades i ..i 6 (a:, (j = x, y, z) son evidentemente análogas de los
vectores unitarios, y se conocen como diadas unitarias. La suma (Bl) se llama d{ada
y las nueve componentes aA,JoA
6 tomadas juntas se denominan componentes de un
tensor de segundo rango. El tensor de segundo rango puede considerarse como una
colección de nueve componentes que están sujetas a ciertas leyes de transfonnación,
al pasar de un sistema de coordenadas a otro, al igual que el vector se puede defmir
mediante tres componentes que obedecen a ciertas reglas de transfonnación de coor-
denadas. Se puede considerar que la díada unitaria obedece a las leyes acostumbradas
de productos vectorial y escalar para los vectores unitarios; por ejemplo

o bien (82)

en donde ~.., es la li Kronecker. En estas circunstancias, las operaciones de produc-


to cruzado y punto entre un tensor y un vector y entre dos tensores, se pueden definir
mediante las reglas para estas operaciones aplicadas a vectores unitarios. Por ejemplo,

537
538 Análisis tensorial

sea un tensor de segundo rango 1 que tiene nueve componentes T.,, que se puede
expresar como
(B3)

y un vector
A= ¿A,.i,.. (B4)
,.
Entonces, de acuerdo con (B2),

Si se suma sobre #J. y, observando que lJ,,. = O, excepto cuando #J.= {3, se
obtiene finalmente
T •A =
-
L L T.,A,i. = (T.x.xA.x + T.x,Ay + TX%A%)i.x
11. ,

+ (T,.xA.x + T"A' + T,zAz:)i,


(BS)

El producto de punto de un tensor y un vector es, por ende, un vector. De la


misma manera, se puede demostrar fácilmente que

A •! = L L T.,A,.i, = (T.x.xA.x + T .xAy + TuAz}i.x


11. ,
1

(B6)

De acuerdo con estos resultados, es obvio que los dos productos de punto
(BS) y (B6) son iguales sólo si ! es un tensor simétrico para el cual =
También se puede demostrar fácilmente que la operación de producto punto
T., T,•.
equivale a una multiplicación matricial. Por tanto, se supone que las componentes
del tensor se consideran como las componentes de una matriz cuadrada de 3 por 3
y las componentes del vector se escriben como una matriz columna. Por tanto, de
acuerdo con las reglas de multiplicación de matrices2
·...
T.x.xT.x,Tnl [A.xl [T.x.xA.x + T.x7 A1 + T.xzAzl
[ T1.xTyyTyz A, = T,.xA.x + TyyA:v + T,zAz =!·A. (B7)
TuT.,Yzz Az TuA.x + Tz:7 A1 + T,,Az
El producto de punto A·! se puede desarrollar en forma similar, excepto que
ahora el vector A debe escribirse como una matriz renglón para efectuar la multipli-
cación.

(B8)

1 El tensor se denotará mediante una letra en tipo negro con subrayado, es decir: !·
2 Para esto, y una explicación más amplia de los tensores, el lector puede consultar D. H.
Men;r;el, Mathematical Physics, Dover Publications, Nueva York (1961), p. 86 ff.
Análisis tensorial 539

El resultado es exactamente el que se da en (B6).


El producto tensorial de dos tensores, que se escribe TU o ! :U se puede
defmir como el producto matricial de las dos matrices componentes, por lo que

(B9)

en donde

(TU),.p = L,. T,.,.U,.p. (BlO)

Del mismo modo, se puede demostrar fácilmente que el producto doble


A •! · B =(A· !) · B =A· (! · B) de acuerdo con (BS) y (B6) es una cantidad
escalar cuyo valor es
(Bll)

El tensor cuyos elementos están dados por T,.p = li,.p se conoce como tensor
unitario o idemtensor L De donde,

!- [~ ! n
De acuerdo con (BS) y (B6) o (B7) y (B8), es evidente que

A·!=!·A=A, (B12)

en tanto que, de acuerdo con (B9) o (BlO) se ve claramente que

Tl = lT=!, (B13)

y, de acuerdo con (Bll), es obvio que

A ·1· B =A· B. (B14)

Las expresiones tensoriales de producto cruzado se pueden evaluar en la misma


manera, utilizando las reglas básicas de los vectores unitarios; por ejemplo

(BlS)

y así sucesivamente. El producto cruzado de un vector y un tensor es, evidente-


mente, un tensor. Los productos cruzados de tensores, no se utilizan en esta obra y
no es necesario ampliar esta explicación para sus fmes inmediatos.
lndice Onomástico

Azaroff, L. V., 20 Hall, R.N., 405,493


Hannay, N.B., 405
Bardeen,J., 520 Haynes,j.R., 371
Blackman, M., 191 Herlet, A., 493
Blatt, F. J., 340 Herman, F., 319
Bloch, F., 232 Herring, C., 340
Bohm, D., 117, 120 Hume-Rothery, W., 276
Boro, M., 69, 188
Bragg, W.L., 32 Ikenberry, E., 100
Brattain, W.H., 532 Jenkins, D.P., 319
Brillouin, L., 54 John, H.F., 485
Brody, T.P. 509 Jones, H., 258, 276
Brooks, H.., 308, 343
Brown, W.L., 532 Kármán, T. von, 188
Burgers,J.M., 416 Keyes, RJ ., 534
Burton, J.A., 396, 405 Keyes, R.W., 345
Kip, A.F., 319
Casimir, H.B.G., 199 Kittel, C., 319
Churchill, R.V., 97, 121,386 Klemens, P.G., 199
Conkwright, N.B., 105 Kronig, R. de L., 236
Conwell, E.M., 305, 319, 335, 344
Cottrell, A.H., 416 Lax, B., 319
Craseman, B., 99 Leighton, R.B., 34, 131, 133, 136,
137,138,192,340
Dash, W.C., 417 Lewis, G.N., 403
Debye, P., 33, 186 Lorentz, H.A., 203
Dexter, R.N., 319 Lowdin, P., 75
Dresselhaus, G., 319
Drude, P., 203 McAfee, K.B., 456
McKay, K.G., 456
Ehrenreich, H., 339 McKelvey, J.P., 374,417
Erginsoy, C., 344 Madelung, E., 69
Esaki, L., 508 Mayer,j.E., 161
Evjen, H.L., 73 Menzel, D.H., 538
Ewald, P.P., 48 73 Merzbacher, E., 108, 128, 141
Meyerhof, W.E., 520
Franz, 203 Milford, F.J., 527
Montgomery, H.C., 532
Garrett, C.G.B., 532 Morin, F.J., 417
Gopert-Mayer, M., 69, 161 Mott, N.F., 258
Greene, R.F., 457 Muss, D.R., 459

541
Indice54 2

Overhauser, A.W., 339 Smith, R.A., 219,248


Sokolnikoff, I.S., y E.S., 162
Pauling, L., 111, 119 Sommerfeld, A., 203
Pearson, G.L., 417, 524 Spenke,E.,246,493
Peierls, R., 199 Stevenson, D.T., 534
Penney, W.G., 236
Pfann, W.G., 404 Tamm, l., 520
Pipes, L.A., 331 Transistor Teachers Summer School (Bell
Powell, J .L., 99 Telephone Laboratories), 3 74

Randall, M., 403 van Roosbroeck, W., 354, 361, 392


Read, W.T., Jr., 392, 416, 417 Vogel, F.L., 417
Reitz,J.R., 527
Rutherford, E., 340 Watson, G.N., 232
Weisskopf, V.F., 335
Scherrer, P., 33 Wertheim, G.K., 417
Schrieffer,J. 532 Whittaker, E.I., 232
Seitz, F., 75, 191,277 Wiedemann, 203
Seraphin, B., 402 Wiesner, R., 497
Sherwin, C.W., 88, 127, 141 Wilson, E.B., 111,119
Shockley, W., 283,.339, 371 392,510,
521,524 Zeiger, H.J., 319
Smith, C.S., 340 Zemansky, MW., 218
Zener, C., 456
Indice temático

Absorción de borde, 348 contribuciones electrónicas,


Acoplamiento giro-órbita, 326 191,224 ff., 242
Aleaciones binarias, 2 7 3 ff. gas de fonones, 192
Aleaciones de cadmio y plata, 275 Cambios de fase, 273 ff.
Antraceno, 402 Cantidad de movimiento angular, o
Aproximación de Boltzmann, 289 ff., momento angular 138
297 ff, 428 ff., 507 ff., operadores, 138 ff.
Aproximación de Debye, 188 ff. valores esperados, 139 ff.
Aproximación de enlaces firme, Cantidad de movimiento del cristal,
255 ff. 240-241 ff., 247, 260, 273
Aproximación del electrón libre, Capacidad térmica, 83, 181 ff.
248 ff.
Aproximación de nivel bajo, 355-356 ff.,
427,443, 470,479 ff. Véase también
Armónicos esféricos, 132 ff. Calor específico
Ataque químico, 379, 387 ff., 389
Atomo de hidrógeno, 84 ff., 128 ff. Capacitancia, uniones p-n, 435 ff.
Atrapamiento, 390 Carburo de silicio, 402
Autoamplificación de la corriente Celda unitaria, 14-15
de saturación, 474 ff., 504 ff. Celda unitaria primitiva, 15
Centros de impurezas, 287 ff., 397
Balance detallado, principio de, 375 concentración, medición, 436 ff.
ff., 393, 440 ff., 517 energía de ionización,
Banda de conducción, 282 ff. 292-293 ff.
Banda de energía prohibida 253, Circuito con emisor a tierra, 473 ff.
264, 269 ff., 282 ff., 336, factor de ganancia de corriente
347 ff., 402, 445,459, 501 474
determinación experimental, Circuito de base abierta, 474 ff.
305,348 Cloruro de cesio, 22, 73
Banda de valencia, 282 ff. Cloruro de sodio, 22, 72 ff.
Banda prohibida, 239, 253 ff., 269 ff. Cobre, 171,392,397,417
Bandas de energía, 239 ff., 253 ff.,
Coeficiente de difusión, 351 ff.,
258 ff., 281 ff.
374
Bandas de energía superpuestas, 271 ff.
ambipolar, 355, 374,479 ff.
Barreras superficiales de potencial, Coeficiente de reflexión superficial,
456, 515 ff.
375 ff., 533
loro, 405 Coeficiente de reflexión volumétrico,
Calor específico de sólidos, 83, 375 ff.
84, 181 ff. Colector, 372-373,463 ff.
teoría clásica, 181 ff. Colisiones, 205 ff.
teoría de Debye, 186 ff. Compensación, 299
teoría de Einstein, 183 ff. Compresibilidad adiabática, 73
543
Indice 544
Compuestos intermetálicos (11-VI), energía de enlace, 69 ff.
28 ff., 402 Cristales metálicos, 29
Compuestos intermetálicos (111-V), Cristales moleculares, 29
23,28,243,360-361,390, Degeneración (cuántica), 135 ff.,
391,401 ff., 479 151, 156 ff., 271, 295 ff.
Condensación de Bose, 178 Densidad de probabilidad, 89
Condición de Bragg, reflexión de Deslizamiento, 413 ff.
Bragg, 33,47 ff., 252, Desviación estándar, 122 ff.
253, 264 ff. Detectores de partículas, 502
Condiciones de frontera periódicas, Detectores infrarrojos, 502
61,150,235,273 Diamante, 282 ff., 401
Conducción térmica, conductividad Difracción de rayos X,31 ff., 416-417
térmica, 195 ff. Difracción electrónica, 83
componente electrónica, 214 ff. Difusión, 351 ff., 373,418-419,
Conductividad de la banda de impurezas, 421 ff., 462, 479 ff., 495 ff.
305 ff., 509 ambipolar, 353 ff., 4 79 ff.
Conductividad de superficie, 273 ff. Difusión ambipolar y arrastre,
Conductividad eléctrica, 206, 209 ff., efectos de, 353 ff., 450 ff.,
269 ff., 302 ff., 327 ff., 479 ff.
530 ff. Difusión, velocidad característica
de superficie, 530 ff. de,454
tensor, 195 ff., 214 ff. Diodos de perforación, 454
térmica, 328-329 ff. Diodos de referencia de voltaje,
Constante de Boltzman, 83, 159, 167 455,460
Constantes de movimiento, 127-128, Diodos túnel, 506 ff.
140, 139 Diodos Zener, 460
Contactos, metal-semiconductor, Dirac, función o de, 213-214,
454-455, 513 ff. 296-297 ff., 368, 523, 528,
Contactos óhmicos, 454 ff., 519 ff. 535 ff.
Corriente de saturación, 440 ff., Dislocaciones, 397,413 ff.
452 ff., 518 ff. tipo borde, 397,413 ff.
autoamplificación, 474-475 ff. tipo tornillo, 413-414 ff.
Crecimiento de cristales, 407 ff. Dispersión, 55 ff.
Czochralski, técnica de, 408 relaciones, 56 ff.
técnicas dentríticas, 408 Dispersión de impurezas, 221,
técnicas epitaxiales, 406 257,313 ff.
proceso de zona flotante, 408 Dispersión de la red, 220, 245,
nivelación de la zona 312 ff., 335 ff., 459, 490-491
horizontal, 407 Dispersión de modo óptico,
Crecimiento epitaxial del cristal, 407 314 ff., 490-491
Crecimiento, etapas del, 415 Dispersión superficial, electrones,
Cristal cúbico, 1 7 221,531
centrado en el cuerpo, 1 7 ff., fonones, 199, 221
268,275 Dispositivos interruptores, 503 ff.
empaquetamiento compacto, 20 Dispositivos interruptores p-n-p-n, 475
centrado en la cara, 17 ff., Dispositivos p-i-n, 479
268,275 Dispositivos semiconductores, 281
simple, 17 ff., 25 7, 261, 268 401,406,408,421,439 ff.,
Cristal hexagonal, 1 7, 268 479 ff., 495 ff.
con empaquetamiento compacto, Distribución de velocidades 163 ff.
20,275 Dulong y Petit, ley de, 83,
Cristal monoclínico, 1 7 182, 183
Cristal ortorrómbico, 17
Cristal tetragonal, 15, 1 7 Ecuación de Boltzmann, 204 ff.,
Cristal triclínico, 1 7 308,352
Cristal trigonal, 1 7, 18 Ecuaciones de continuidad, 350 ff.
Cristales covalentes, 27-28 corriente eléctrica, 44 7-448
Cristales iónicos, 27-28, 67 ff. electrones y huecos, 350 ff.
Indice 54 5
densidad de portadores en Factor de amplificación de corriente,
exceso, 354 ff., 3 79 ff., 465ff.
383 ff., 442 ff., 467 ff., dependencia de la frecuencia, 471ff.
482 ff. circuito con emisor a tierra, 474
Efecto de campo, experimento de, medición, 4 7 5
523 ff. Factor de dispersión atómica,
Efecto de perforación, 454 3 7 -38ff.
Efecto de Zeeman, 141 Fermi-Dirac, estadística de, 168ff.,
Efecto fotoeléctrico, 81 212ff., 225ff., 281,289,
Efecto fotovoltaico, 495 ff. 426ff., 507ff., 517ff.,
Efecto túnel, 109, 456 ff., 507 ff., para niveles de impurezas, 29 5-
513 ff. 296ff.
Efectos de campo internos, 352 ff., Flujo de difusión, 351ff., 440ff.
423 ff., 479 ff. Fonones, 191ff., 335ff.
Efectos galvanomagnéticos, 222 ff. Fórmula de Brooks-Herring, 343
Véase también Ettingshausen, Fórmula de Conwell-Weisskopf 343
efecto de, Hall F otoconductividad, 34 7ff.
efecto de, Nernst, estado estacionario 3 79ff.
efecto de, Righi-Leduc, transitoria, 383ff., 412ff., 489
efecto de, Fototransistor, 502
Efectos inarmónicos, 69, 193 ff., Foto voltaje, 496ff.
196 ff. l'recuencia de ciclotrón, 307, 316ff.
Efectos termoeléctricos, 215 ff. Frenkel, defecto de, 418ff.
Eficiencia de inyección, 446ff., Frontera de grano, 415ff.
467ff., 481ff., 504ff. Frontera lineal de Burgers, 416ff.
Eficiencia de rectificación, 445 Fuerzas de Van der Waals, 29-30
Einstein, relaciones de, 351ff., Función de densidad de estados, 148ff.,
374,486 273ff.
Einstein, temperatura de, 184 aleaciones binarias, 273ff.
Elementos de simetría, 15 sistema de la partícula libre,
Emisión de campo, 456ff. 149ff.
Emisor, 372-373, 463ff. semiconductor con impurezas, 295ff.,
Energía de Fermi, nivel de Fermi, 327ff.
170,244,262,423,513ff. semiconductor intrínseco, 285,
gas tridimensional de electrones 327ff.
libres, 171 teoría cuántica, 273ff.
gas ideal bidimensional, 1 70
semiconductores, 285ff.
variación con la temperatura, Función de distribución, 148ff.
171 Bose-Einstein, 175ff.
Fermi-Dirac, 168ff.
Energía del punto cero, 115 Maxwell-Boltzmann, 159ff.
Enlaces covalentes, 27, 283ff., 347 en situaciones de no equilibrio,
Entropía, 161 204ff.
Equivalencia cristalográfica, 23ff. Función de Creen, 3 70
Espacio de fase, 147ff., 204ff. Función de onda, 88ff.
Estadística de Bose-Einstein, 1 76ff., estado estacionario o uniforme,
192 92ff.
Estados superficiales, 5 20ff. Función de trabajo, 81,513ff.
rápidos y lentos, 533 Funciones de Bloch, 234ff., 249, 256,
Estaño, 23, 28ff., 401 267
Estructura geométrica, factor de, 41ff. Funciones propias, 93ff.
Ettingshausen, efecto de, 224 pares e impares, 108
Exceso de portadores, 347ff.
generación de, 34 7, 348ff., 495ff. Gas de electrones libres, 1 70ff., 203ff.
tiempo de vida, 349ff. conductividad eléctrica, 209ff.
recombinación 348ff. capacidad térmica, 191
Expansión térmica, 193ff. conductividad térmica, 209ff.
lndice 54 6
Gas de electrones libres de Fermi, compuestos intermetálicos 111-V,
1 70ff., 203ff. 401
degenerado, 172, 587ff. tensor, 260,261,320-312ff.
Gas ideal, 161ff. Matrices, mecánica de, 88
ecuación de estado, 167 Maxwell-Boltzmann, estadística de,
Gauss, teorema del flujo eléctrico de, 152-153ff., 184, 186, 199, 209ff.,
431,527 223, 281, 289ff., 351, 376, 393,
Generación térmica, 283ff., 348ff., 425ff., 441ff.
375ff., 440ff. Maxwell-Boltzmann, integrales de, 164
Germanio. 281ff., 401ff. Mecánica ondulatoria, 88ff.
Giro (electrón), 141ff. Metales alcalinos, 29, 271
Hall, efecto de, coeficiente de Hall, Metales de transición, 144, 275
222ff., 272, 306-307ff., 326ff., Miller, índices de, 23ff.
411 Modos normales, 60
Movilidad, 211, 199, 314ff., 334, 335ff.,
Hall, movilidad de, 315, 334, 412
351, 371ff., 411, 491ff., 530ff.
Haynes-Shockley, experimento de, 371ff.,
464ff. Movilidad de arrastre, 315, 334, 371ff.,
Heisenberg, principio de incertidumbre 491ff.
de,99 Movilidades, relación de, 304ff.,
Hermite, polinomios de, 116 401,446,479,482ff.
Hipótesis ondulatoria de DeBroglie, Movilidad superficial, 530ff.
87,94 Multiplicadores de Lagrange, método
Huecos, conducción por huecos, 24 7, de los, 157
269-270ff., 283ff. Nernst, efecto de, 224
huecos "ligeros" y "pesados", Neutralidad eléctrica, condición de,
307 354ff., 473, 471, 479ff.
Impurezas de atrapamiento, 392 Niveles de donadores, 292ff., 397
Impurezas donadoras, 287ff., 292-293ff., Niveles cuasi-Fermi, 427ff.
397 Niveles receptores, 292ff., 293
Impurezas receptoras, 287ff., 397 Número de Avogadro, 83,159-160, 167
Interacciones electrón-electrón, 219 Número de coordinación, 23
lrteracciones electrón-fonón, 220,
245, 312ff., 335ff., 459 Ohm, ley de, 206ff.
Interacciones fonón-fonón, 195ff. Operadores, 88ff.
Inyección de portadores, 371ff., Operador hamiltoniano, 88, 89, 256-257
441, 463ff., 479., 519 ) Ortogonalidad, 119ft, 386
Irradiación residual (Reststrahlen), Oscilación de Zener, 245
69 Oscilador armónico clásico, 83, 181ff.
cuántico (unidimensional), lllff.,
Kronig-Penney, modelo de energía 183ff.
potencial de, 235ff., 265, 269,
402,520 Partícula libre, 94ff., 149ff., 203ff.,
240-241ff., 284ff., 335ff.
Laguerre, ecuación de, 132
Penetración de barrera, 108
Laguerre, polinomios de, 132
Planck, constante de, 80
Laue, ecuaciones de, 37ff.
Planos del cristal, 23ff.
Legendre, ecuación de, 131
Planos del cristal, espaciamiento
Legendre, polinomios de, 131
de, 25ff.
Longitud de Debye, 360, 525
Poisson, ecuación de, 353ff., 428ff.,
Longitud de difusión, 359, 361ff.
525ff.
Madelung, constante de, 73 Potencia termoeléctrica, 217-218
Magnetorresistencia, 224, 306ff., 333 Potencial de contacto, 495, 513ff.
Masa efectiva, 242ff., 253, 254, 260, Véase también Potencial de
274,285ff.,401 contacto interno
equivalente, de conductividad Potencial de contacto interno, 424ff.,
331,339 495ff.
equivalente de la densidad de medición, 436ff.
estados, 327ff., 339 Potencial de deformación, 33 7ff.
Indice 54 7

Pozo de potencial, finito, 103-104ff. Schottky, defecto de, 418ff.


infinito, lOOff. Schrodinger, ecuación de, 89ff., 233,
parabólico, lllff. 248ff., -256, 402 5-256, 402
Principio de exclusión de Pauli, independiente del tiempo, 92ff.
142-144, 168-169 Sección transversal, dispersión, 205,
Procesos de dispersión, 219-220ff., 340ff.
335ff. Segregación de impurezas, 403ff.
dispersión de impurezas, 221, Semiconductor, 28, 269-270, 281ff.
340-341ff. extrínseco, 299
dispersión entre valles, 326, intrínseco, 283ff.
339,340,491 tipo n, 286ff.
dispersión de red, 221, 245-246, tipo p, 287ff.
335ff. Semiconductor extrínseco, 299-300
efectos de modo óptico, 339ff. Semiconductor intrínseco, portadores
Promedios (estadísticos), 149-150, intrínsecos, 322ff.
210-21lff., 303-304ff. concentración de portadores, 291
energía de Fermi, 292
Radiación del cuerpo negro, 79 Semiconductores con impurezas, 286ff.,
Receptores,divalentes, 397-398 295ff.
Recombinación, portadores de carga, efectos de ionización incompleta,
348ff., 374ff., 383ff. 390ff., 300ff., 306ff., 343-344
464-465ff. Silicio, 271, 385ff., 401ff.
mecanismos de, 390ff. Sistema periódico de los elementos, 142ff.
Recombinación superficial, 374ff., Sistemas cristalinos, 15, 17ff.
451ff., 533 Sodio, 271
Recombinación superficial, velocidad Sólido amorfo. 13
de, 378, 452ff., 533 Sólido cristalino, 13
Rectificador de puntos de contacto, Sulfuro de cadmio, 402
371ff., 463ff., 517ff. Superficie de Fermi, 173, 262ff.
Rectificadores, unión p-n, 439ff. Superficies de energía constante, 155ff.
efectos del tamaño y la superficie,
elipsoidales, 307, 316-317ff.
451ff.
Superficies de semiconductores, 51 7ff.
Red de Bravais, 15
Superposición de ondas elásticas, 53-54,
Red del diamante, 22, 282ff.
60-61
Red recíproca, 43ff., 264ff.
soluciones de ecuaciones de
Refinamiento de zona, fusión de zona,
continuidad, 385, 501
402ff.
funciones de onda, 95ff., 102, 136,
Región de acumulación, 516ff.
Región de deficiencia, 515ff. 137,241
Región de inversión, 516ff. haces de rayos X, 36-37ff.
Región de la base, 467ff.
Regiones de carga espacial, 422ff., 524ff., Tecnología de materiales, 40 lff.
Relación, tiempo de, 205ff., 304ff., mediciones, 408ff.
335ff., 533 preparación, 401ff.
Representación de zona reducida, 243ff., Temperatura de Debye, 189ff.
265ff. Tensor, 260-261, 322ff., 537ff.
Resistencia negativa, 507 Teorema de Bloch, 232ff.
Resistividad, mediciones de, 408ff. Teoría del electrón libre en los
Véase también Conductividad metales, 203ff., 242
Teoría de los átomos de Bohr, 84ff.
Resonancia de ciclotrón, 316-317ff. aplicada a centros de impurezas,
R.ighi-Leduc, efecto de, 224 292ff.
Ruptura, 441,447,455, 456ff., 507 Thomson, calentamiento de, 217
por avalancha, 456ff. Thomson, coeficiente de, 217
Zener, 456ff., 507 Tiempo de vida, exceso de portadores.
Shockley-Read, teoría de la 349ff., 383ff., 402, 418
recombinación de, 390ff., 533 medición, 412
Schottky, defecto de, 418ff. Tiempo libre medio, 205
Indice 54 8
Véase también Tiempo de relajación Vectores de base primitivos, 15
Velocidad de fase, 52ff.
Transiciones directas, 390ff. Velocidad de Fermi, 214
Transiciones indirectas, 390ff. Velocidad de grupo, 53ff., 241
Transistor de efecto de campo, 509 Vibraciones de la red, véase
Transistor unipolar, 509 Vibraciones elásticas
Transistores, 374,446,461, 463ff., Vibraciones de modo acústico, 64ff.
502,509 Vibraciones de modo Óptico, 64ff.
Trayectoria libre media, 196ff., 209, Vibraciones elásticas, 51ff., 18lff.,
457ff. 191ff., 220, 246-247, 293-294{f.,
335ff., 491ff.
Unión p-n, tecnología de elaboración rama acústica, 63-64ff., 191,
de la, 459ff. 3.12ff., 335ff., 459, 491ff.
métodos de aleación, 459ff. inarmonía, 69, 193ff:
métodos de difusión, 461ff. medio continuo, 51ff.
técnicas de crecimiento 'de red diatómica, 62
uniones, 459 regiones de frecuencias prohibidas,
Uniones p-n, 348, 421ff., 439ff., 66,67
479ff., 495ff. forzadas, 67ff.
abruptas, 421ff., 429-430ff., 460ff. red monoatómica, 55ff., 181ff.
capacitancia, 435ff. rama óptica, 64ff., 191, 339ff.,
graduadas, 42lff., 460ff. Voltajes de polarización (uniones p-n),
vacantes de la red, 418ff. 425ff.
Valores esperados, 89, 92, 94, 123ff.,
139,142,257 Wiedermann-Franz, relación de, 203,
Valores K, 403ff. 218ff.
efectivos, 404ff.
equilibrio,. 403ff. Zincblenda, estructura de la, 22, 23,
Valores propios 93ff., 387 40lff.
continuos y discre'tos, 110 Zonas de Brillouin, 60ff., 260ff.,
Vectores base, 14, 15 265ff., 319ff.

--oOo--

IMPRESO EN PROGRAMAS EDUCATIVOS, S.A. DE C.V. • 014912,500 08 96 530

S-ar putea să vă placă și