24
I ds I ds g m g ds C gs C gd D gs D gd

CAPÍTULO Modelado de gran señalbibing.us.es/proyectos/abreproy/12120/fichero/Capítulo_4... · Figura 4.1: Circuito equivalente de gran señal de un transistor de efecto de campo

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • CAPÍTULO 4

    Modelado de gran señal

    Con el modelado de gran señal se obtiene una caracterización más com-pleta del dispositivo, ya que nos permite obtener información sobre su com-portamiento no lineal, con diferentes condiciones de funcionamiento, ya seaen régimen de continua (DC) o RF, siendo además capaz de predecir algunosefectos no deseados, como son los efectos térmicos debidos a variaciones enla temperatura durante el funcionamiento del dispositivo.

    Este modelado abarca tanto elementos lineales, como son los elementosextrínsecos extraídos como se detalla en el capítulo anterior (resistencias,inductancias y capacidades parásitas), como elementos no lineales, que sonlas capacidades, diodos y la fuente de corriente de drenador Ids, la cual es laque introduce una mayor no linealidad en el modelo.

    Existen numerosos modelos de gran señal, entre los más conocidos desta-can el modelo de Curtice, Materka o Angelov, que se detallan más adelante,y la mayor diferencia entre ellos reside en la expresión matemática de lafuente de corriente (Ids), de la que dependen la transconductancia (gm) yla conductancia de salida (gds), y también en la de las capacidades puerta-fuente y puerta-drenador (Cgs y Cgd) o en la de los diodos (Dgs y Dgd). Estoselementos del circuito equivalente, que se muestra en la �gura 4.1, son losque se corresponden con las características no lineales del dispositivo.

    Los modelos eléctricos del transistor son indispensables para la simulacióny el diseño de circuitos integrados. En general, existen dos enfoques diferentesbajo los que se puede clasi�car el modelado de transistores: los modelosfísicos y los empíricos.

    41

  • Ana María Benítez Lara

    Figura 4.1: Circuito equivalente de gran señal de un transistor de efecto de campo.

    Los modelos físicos se basan en los parámetros físicos del semiconductorque describen la geometría del dispositivo, como pueden ser la longitud ola anchura de puerta, la anchura del canal o la densidad de carga de dopa-do. Estos modelos se basan en una serie de ecuaciones electromagnéticas yde transporte de carga. El carácter analítico de estas funciones es de granimportancia ya que sus discontinuidades y derivadas pueden causar inestabi-lidades numéricas y, por tanto, imprecisiones en la predicción de armónicosy distorsión. Uno de los problemas con estos modelos físicos es que normal-mente son válidos dentro de un rango de condiciones de polarización, fueradel cual deberían usarse otras expresiones. Por esto, se usan técnicas parael ajuste de curvas y super�cies que aseguren una transición continua deuna región a otra. Una de las ventajas de estos modelos es que los paráme-tros tienen un signi�cado físico y esto puede usarse para validar la correctaextracción de sus valores y predecir el comportamiento de los nuevos disposi-tivos del mismo tipo. Sin embargo, en la práctica, la mayoría de los modelosfísicos contienen cierto grado de empirismo. Además, a veces se hace imposi-ble llegar a soluciones cerradas para los parámetros de algunos dispositivos,haciéndose necesario el uso de un enfoque empírico.

    Los modelos empíricos dependen de características medidas directamentedel dispositivo que describen su comportamiento. Hace uso de expresionesanalíticas y los parámetros son derivados del ajuste de curvas o super�ciesa esas medidas. Pueden conocerse como modelos de caja negra o, si se cono-cen algunas propiedades físicas de la estructura del dispositivo a priori, de

    42

  • 4. MODELADO DE GRAN SEÑAL

    circuito equivalente. Estos modelos requieren menor esfuerzo computacio-nal que los anteriores y pueden desarrollarse considerablemente más rápidoque los modelos puramente físicos. Son los más usados en el modelado conherramientas CAD.

    La principal diferencia entre estos dos tipos de modelo es que en el em-pírico, los parámetros a determinar de las expresiones se obtienen a partirde medidas experimentales radioeléctricas, como son los parámetros S o lasmedidas en DC y pulsadas, mientras que el físico fuerza al modelador a dis-poner de parámetros propios de la tecnología de fabricación, los cuales no seencuentran normalmente a su alcance.

    La elección de un tipo de modelo u otro dependerá de la estructura físicadel dispositivo, así como de las aplicaciones para las que el modelo está desti-nado. Existe una gran controversia entre complejidad y precisión. Un modelocomplejo con demasiados detalles físicos del dispositivo que no sean impor-tantes para las aplicaciones posteriores, podría complicar innecesariamenteel proceso de extracción del modelo, provocar un mayor esfuerzo computacio-nal y retardar el proceso de modelado. Por tanto, una elección razonable dela complejidad del modelo es uno de los factores de mayor importancia enla obtención de un diseño e�ciente [21].

    4.1. Modelo de Curtice cuadrático

    Curtice presenta en [22] un modelo analítico simple para los MESFET deGaAs, que resulta útil para su implementación en programas de simulaciónde circuitos. En primer lugar hace una revisión de algunos de los modelosya existentes y los discute para llegar a un modelo preciso. Presenta lasecuaciones analíticas de la corriente de drenador Ids y de la capacidad depuerta Cgs para un circuito equivalente como el de la �gura 4.1 a excepcióndel diodo Dgd.

    La relación entre la corriente de drenador y las tensiones drenador-fuenteVds y puerta-fuente Vgs se conoce normalmente a través de medidas experi-mentales en los dispositivos de prueba. El modelo debe hacer uso de expre-siones analíticas que aproximen esta relación. A menudo, para determinar elvalor de la mayoría de los parámetros se requieren técnicas de ajuste de cur-vas. En el análisis de modelos de JFET, la corriente controlada por tensión

    43

  • Ana María Benítez Lara

    toma la forma:

    Ids = Ip

    [1 +

    Vgs + VBIVp

    ]N(4.1)

    donde Ip es la corriente de pinch o�, comunmente conocida como corrientede saturación, Vp es la tensión de pinch o� expresada como qN0a

    2/2� paradopado uniforme, VBI es la tensión de �built-in� en la puerta (negativa), Vgses la tensión puerta-fuente, a es el espesor de la capa activa y N0 es el númerode donantes. N puede variar entre 2 y 2.5, dependiendo de la distribuciónde carga.

    Otra forma de expresar esta corriente, sólo para saturación y bajo lasuposición de que el espesor de la capa de agotamiento es el mismo que elde una unión abrupta, puede ser:

    Ids = Ip

    [1−

    √|Vgs + VBI |

    Vp

    ](4.2)

    La ecuación (4.1) puede escribirse de forma más genérica como:

    Ids = β(Vgs + VT )2 (4.3)

    donde VT es la tensión umbral y β = Ip/Vp2. Esta última expresión resalta

    la dependencia aproximadamente cuadrática de la corriente de drenador conrespecto a la tensión Vgs.

    La corriente de saturación en los MESFET se da a bajos voltajes, loque provoca un efecto de saturación de corriente bastante fuerte. La funcióntangente hiperbólica puede modelar este efecto de saturación. Además, elmodelo también debe ser capaz de describir la conductancia de salida para loque es necesario añadir el término (1 + λVds). En resumen, Curtice proponela siguiente ecuación para la corriente, que reune las tres característicascomentadas en cada uno de sus términos:

    Ids (Vgs, Vds) = β(Vgs + VT )2 (1 + λVds) tanh (αVds) (4.4)

    Por tanto, existen cuatro parámetros que deben ser ajustados: α, β, λ y VT .

    Derivando (4.4) con respecto a Vgs y Vds se obtienen las expresiones para

    44

  • 4. MODELADO DE GRAN SEÑAL

    la transconductancia y la conductancia de salida:

    gm =∂Ids∂Vgs

    = 2β (Vgs − VT ) (1 + λVds) tanh(αVds =

    2

    Vgs − VT

    )Ids (4.5)

    gds =∂Ids∂Vds

    = β(Vgs − VT )2[α (1 + λVds)

    cosh2 (αVds)+ λ tanh (αVds)

    ](4.6)

    El modelo predice que todas las derivadas de la transconductancia soncero a partir de orden 3, siendo esta una de las principales limitaciones paraaplicaciones a circuitos fuertemente no lineales [19].

    En cuanto a las capacidades, se modelan como un diodo Schottky. Paratensiones negativas, cada diodo se polariza de la misma manera y ambascapacidades son aproximadamente iguales. Sin embargo, a medida que Vdsse incrementa, aumenta en mayor medida la región de deplexión en el lado dedrenador comparada con la de la puerta y Cgd se hace mucho más pequeñaque Cgs. Si se llega a la saturación de la corriente se cumple que Cgd � Cgs.

    La capacidad puerta-fuente tiene una expresión analítica obtenida a partirde la capacidad de una unión metal-semiconductor ideal:

    Cgs (Vgs) =Cgs (0)√1− VgsVBI

    (4.7)

    donde Cgs0 es el valor de la capacidad en ausencia de polarización.

    Statz propone una nueva expresión para la corriente en [23], que derivadel modelo cuadrático de Curtice, pero que a�rma que para valores elevadosde Vgs − VT la dependencia cuadrática de la corriente con Vgs se vuelveaproximadamente lineal de la siguiente manera:

    Ids =β(Vgs − VT )2

    1 + b (Vgs − VT )(1 + λVds) tanh (αVds) (4.8)

    Por tanto, el modelo cuadrático de Curtice queda relegado a valores dondeVgs−VT ' 0. Hay que notar que ambos modelos toman una función para lacorriente que es posible separar en dos variables de la forma Ids = F1 (Vgs) ·F2 (Vds).

    45

  • Ana María Benítez Lara

    4.2. Modelo de Materka-Kacprzac

    El modelo que Materka y Kacprzac presentan en [24] tiene el mismo cir-cuito equivalente que el de la �gura 4.1. A�rman que para el estudio detransistores, los elementos principales del modelo que introducen no lineali-dades son la capacidad equivalente puerta-fuente Cgs, los diodos Dgs y Dgd,y la corriente Ids.

    La capacidad puerta-fuente está dada por la misma expresión que enel modelo de Curtice, véase (4.7), para valores de Vgs ≤ 0,8VBI , y paraVgs ≥ 0,8VBI se hace una aproximación con una recta de pendiente igual ala derivada ∂Cgs/∂Vgs con Vgs = 0,8VBI .

    La corriente en cada uno de los diodos viene dada por una ecuación similara la de Schottky, de la forma:

    Igs = Is [exp(αsVgs)− 1] (4.9a)Igd = Isr [exp(αsrVdg)− 1] (4.9b)

    donde Is, Isr, αs y αsr son parámetros del modelo a ajustar. La corrienteen el diodo Dgd se aproxima a la corriente de ruptura y el diodo Dgd norepresenta ninguna unión de barrera Schottcky o p-n conectada entre losterminales de puerta y drenador. Es por esto por lo que los valores de losparámetros Is y αs son completamente diferentes de los de Isr y αsr.

    La expresión para la corriente di�ere en mayor medida con respecto almodelo de Curtice:

    Ids (Vgs, Vds) = Idss

    (1− Vgs

    Vp

    )2tanh

    (αVds

    Vgs − Vp

    )(4.10a)

    Vp = Vp0 + γVds (4.10b)

    donde Idss, Vp0, α y γ son parámetros del modelo.

    Las expresiones de la transconductancia y de la conductancia de salidase obtienen derivando la corriente:

    gm =−2IdssVT

    (1− Vgs

    VT

    )tanh

    (αVds

    Vgs − VT

    )− αVdsIdss

    VT2

    1

    cosh2

    (αVds

    Vgs − VT

    )(4.11)

    46

  • 4. MODELADO DE GRAN SEÑAL

    gds =2γVgsIdss

    VT2

    (1− Vgs

    VT

    )tanh

    (αVds

    Vgs − VT

    )+

    αIdss

    VT2 [(Vgs − VT + γVds)]

    1

    cosh2

    (αVds

    Vgs − VT

    )(4.12)

    4.3. Modelo de Curtice-Ettenberg

    Curtice y Ettenberg proponen en [25] un modelo similar al que propo-ne Materka, del cual aprueban su validez pero incluyen algunas diferenciassigni�cativas. En el presente modelo se introduce una aproximación cúbi-ca, a diferencia del anterior, que se conformaba con modelar la relación dela corriente de drenador con la tensión puerta-fuente a través de una leycuadrática. Así, la corriente toma la siguiente expresión:

    Ids =(A0 + A1V1 + A2V1

    2 + A3V13)

    tanh (γVds) (4.13)

    donde V1 es la tensión de entrada y Ai son los coe�cientes del modelo aajustar y se pueden obtener a partir de medidas en la región de saturaciónminimizando el error cuadrático medio. Una de las desventajas de esta apro-ximación cúbica es que, a diferencia de la aproximación cuadrática, puedeaparecer una corriente de pinch o� tal que anula la corriente o la transcon-ductancia, pero no ambas. Considerando este fenómeno donde la tensión depinch o� aumenta con Vds se tiene:

    V1 = Vgs (t− τ)[1 + β

    (Vds

    0 − Vds (t))]

    (4.14)

    donde β es el coe�ciente que mide el cambio en la tensión de pinch o�, Vds0

    es la tensión (en saturación) a la que se han extraído los coe�cientes Ai y τes el retardo de tránsito interno al FET, y es también proporcional a Vds:

    τ = A4Vds (t) (4.15)

    La conductancia de salida depende también fuertemente de Vds y Vgs ypuede obtenerse su expresión de pequeña señal en RF hallando la derivadade la corriente del modelo, de tal forma que:

    gds =1

    Rds− gm0βVgs +

    γIds(1/cosh2 (γVds))

    tanh (γVds)(4.16)

    donde

    gm0 =(A1 + 2A2V1 + 3A3V1

    2)

    tanh (γVds (t)) (4.17)

    47

  • Ana María Benítez Lara

    Cada uno de los términos que forman la expresión de gds pueden inter-pretarse como: un término de conductancia �ja, un término de conductanciade substrato que causa el cambio en la tensión de pinch o� con Vds y, porúltimo, un término de conductancia de canal que sólo es importante paravalores de Vds bajos, por debajo de la región de saturación.

    La transconductancia gm puede evaluarse de forma similar a la conduc-tancia de salida derivando la corriente respecto a Vgs, de manera que:

    gm = gm0[1 + β

    (Vds

    0 − Vds (t))]

    (4.18)

    donde el coe�ciente β hace que la transconductancia decrezca con el aumentode Vds, lo cual concuerda con el comportamiento de dispositivos FET deGaAs.

    4.4. Modelo de Angelov

    Algunos de los modelos anteriores, como el de Curtice o Materka, só-lo describen el comportamiento de gran señal de dispositivos MESFET. Apesar de que también se podrían ajustar a la característica I-V de transis-tores HEMT, hay algunas propiedades de estos que no tienen en cuenta. Latransconductancia es una de las no linealidades del comportamiento de dis-positivos FET que presenta aspectos más críticos e in�uye en mayor medidaen el estudio de efectos de gran señal. La diferencia más importante entre latransconductancia de dispositivos MESFET y HEMT es la existencia de unpico en los últimos, a partir del cual la transconductancia se degrada [19].

    Angelov propone en [26] un nuevo modelo para MESFETs y HEMTscapaz de modelar la característica I-V y sus derivadas, incluyendo el picode la transconductancia así como las capacidades puerta-fuente y puerta-drenador. La corriente de drenador Ids se expresa, de acuerdo a modelosanteriores, como:

    Ids (Vgs, Vds) = IdA (Vgs) IdB (Vds) (4.19)

    donde el primer término depende sólo de la tensión de puerta Vgs y el se-gundo de la tensión de drenador Vds, y es el mismo que el de los modelosde Curtice y Statz. Para el primer término, sin embargo, Angelov propo-ne una función cuya primera derivada tiene la misma �forma acampanada�que la transconductancia en función de Vgs. La tangente hiperbólica (tanh)

    48

  • 4. MODELADO DE GRAN SEÑAL

    describe la dependencia con Vgs y sus derivadas:

    Ids = Ipk (1 + tanhψ) (1 + λVds) tanh (αVds) (4.20)

    donde Ipk es la corriente de drenador a la cual la transconductancia se hacemáxima, siendo nula la contribución de la conductancia de salida, λ es lalongitud del canal de modulación y α la tensión de saturación. Los paráme-tros α y λ son los mismos que los del modelo de Curtice y Statz, y ψ esuna serie de potencias centrada en Vpk que varía con Vgs, como se describea continuación:

    ψ = P1 (Vgs − Vpk) + P2(Vgs − Vpk)2 + P3(Vgs − Vpk)3 + ... (4.21)

    donde Vpk es la tensión de puerta para máxima transconductancia gmpk. Lafunción Ids(Vgs, Vds) tiene sus derivadas bien de�nidas. Una ventaja de es-te modelo es su simplicidad. Los diferentes parámetros pueden obtenersefácilmente en primera aproximación por inspección de las medidas de co-rriente en condiciones de saturación como sigue: los términos mayores de ψpueden suponerse nulos, λ se determina de la pendiente de la característicaIds − Vds, Ipk y Vpk se determinan en el pico de la transconductancia gmpky, esta última, se calcula de las medidas de la transconductancia máximagmpkm teniendo en cuenta el efecto de realimentación debido a la resistenciade fuente Rs, que puede obtenerse realizando medidas en DC:

    gmpk =gmpkm

    (1−Rsgmpkm)(4.22)

    Así, P1 puede obtenerse como:

    P1 = gmpkm (1 + λVd) 'gmpkIpk

    (4.23)

    En algunos HEMTs, Vpk depende débilmente de Vds en la región de satu-ración. Este efecto puede modelarse por:

    Vpk = Vpk0 + γVds (4.24)

    En la región donde no hay saturación y Vds es negativa, Vpk puede variarconsiderablemente con Vds.

    El mismo tipo de modelado se ha elegido para las capacidades Cgs y Cgd:

    C (Vgs, Vds) = CA [tanhVgs]CB [tanhVds] (4.25)

    49

  • Ana María Benítez Lara

    Debido a la similitud con Ids, estas funciones se pueden expresar como:

    Cgs = Cgs0 [1 + tanhψ1] [1 + tanhψ2] (4.26a)

    Cgd = Cgd0 [1 + tanhψ3] [1 + tanhψ4] (4.26b)

    donde

    ψ1 = P0gsg + P1gsgVgs + P2gsgVgs2 + P3gsgVgs

    3 + ... (4.27a)

    ψ2 = P0gsd + P1gsdVds + P2gsdVds2 + P3gsdVds

    3 + ... (4.27b)

    ψ3 = P0gdg + P1gdgVgs + P2gdgVgs2 + P3gdgVgs

    3 + ... (4.27c)

    ψ4 = P0gdd + (P1gdd + P1ccVgs)Vds + P2gddVds2 + P3gddVds

    3 + ... (4.27d)

    El término P1ccVgsVds re�eja el acoplamiento de Vgs y Vgd en Cgd. Cuandoes su�ciente con una precisión del 5-10%, Cgs y Cgd pueden simpli�carsecomo sigue:

    Cgs = Cgs0 [1 + tanh (P1gsgVgs)] [1 + tanh (P1gsdVds)] (4.28a)

    Cgd = Cgd0 [1 + tanh (P1gdgVgs)] [1− tanh (P1gddVds + P1ccVgsVds)] (4.28b)

    La ecuación (4.28b) se simpli�ca aún más si se desprecia el acoplamientoentre Vgs y Vds en Cgd (Vds ≥ 1). Cgd puede expresarse entonces como:

    Cgd = Cgd0 [1 + tanh (P1gdgVgs)] [1− tanh (P1gddVds)] (4.29)

    4.5. Modelo de Mediavilla de doble fuente

    Mediavilla propone en [27] un nuevo modelo de dos fuentes para dispo-sitivos MESFET y HEMT que es capaz de simular los efectos de dispersióna bajas frecuencias, teniendo en cuenta tanto los efectos de captura comolos efectos térmicos y de autocalentamiento del transistor (dependencia conel punto de polarización). Considerando estos efectos, la corriente Ids estámodelada mediante dos fuentes no lineales diferentes: una simula las carac-terísticas en DC y la otra representa el comportamiento de la señal en RFen cada punto de polarización.

    La principal diferencia con los modelos anteriores es que la fuente decorriente no lineal Ids queda entonces dividida en dos fuentes de corrienteIds1 e Ids2. Además, se añaden unas redes L-C de tipo paso-bajo que extraenlos valores de las tensiones en DC (Vgcc y Vdcc), así como una capacidad lineal

    50

  • 4. MODELADO DE GRAN SEÑAL

    Clf que, junto con Ids2, y en paralelo con Ids1 es la que modela la dispersióna bajas frecuencias. Así, Ids toma la siguiente expresión:

    Ids (Vgs, Vds, Vgcci, Vdcci) = Ids1 (Vgs, Vds) + Ids2 (Vgs, Vds, Vgcci, Vdcci) (4.30)

    donde Ids1(Vgs, Vds) representa la característica en DC del transistor y puedemodelarse usando la ecuación de Materka, e Ids2(Vgs, Vds, Vgcci, Vdcci) repre-senta el comportamiento en RF del dispositivo en cada punto de polarización.La ecuación completa viene dada por:

    Ids = Idss (Vgcci, Vdcci)

    ×(

    1− VgsVt (Vgcci, Vdcci) + γ (VdcciVds)

    µ+δVgs)

    ×(

    1 + λ (Vgcci, VdcciVds) tanh

    (α (Vgcci, Vdcci)

    IdssVds

    ))(4.31)

    y está basada en la ecuación del modelo de Materka. Hay por tanto seis pa-rámetros de ajuste: Idss, Vt, γ y λ, que son dependientes de la polarización,mientras que µ y δ son constantes propias de cada transistor. Idss es unode los parámetros de más peso por multiplicar a toda la ecuación y tenerun valor muy alto. Esto signi�ca que pequeñas variaciones en el resto deparámetros se traducen en una gran variación de la corriente. Este efectoes más notable en transistores MESFET de potencia. Sin embargo, el mo-delo podría suavizar este efecto usando el parámetro Idss para controlar lapendiente de la parte lineal de las curvas características del transistor. Lavariación de Idss con el punto de operación viene dada por:

    Idss =β

    |Vgcci − 1|p ((1 + Vdcci)q)(4.32)

    donde Vgcci y Vdcci son las tensiones independientes correspondientes al puntode operación del transistor (Vgscc,Vdscc), los exponentes p y q son parámetrosindependientes de la región de corte y β es una función de Vgcci y Vdcci quetiene en cuenta dos fenómenos: uno es el cambio en la disipación mediade potencia (autocalentamiento) con el punto de operación y, el otro, lavariación de la resistencia de canal, de forma que:

    β = β0Vgcci + β1 + ((β2Vgcci + β3)Vdcci)β4 (4.33)

    Volviendo a la expresión (4.31), Vt representa el comportamiento en pincho�, muy común en el modelado no lineal. Analizando el término que controlaesta región, se puede ver que es dependiente de Vgs a través del parámetroγ, y esto signi�ca que el modelo es capaz de predecir de manera precisa la

    51

  • Ana María Benítez Lara

    región de baja corriente. Se propone la siguiente ecuación para representarla variación de Vt:

    Vt = Vt0Vgcci + (Vt1Vdcci + Vt2) (4.34)

    El comportamiento de la región de pinch o�, resultante de variaciones enVdcci, se corrige usando el parámetro γ:

    γ = γ0 + γ1 Vdcci√γ2 (4.35)

    Las ecuaciones (4.34) y (4.35) representan el comportamiento del tran-sistor en la región de baja corriente no sólo como función de Vgs y Vds sinotambién como función del punto de operación.

    El factor (1 + λVds) de la ecuación (4.31) representa la conductancia desalida y λ, que tiene dimensiones de conductancia, es la responsable de lapendiente de las curvas de Ids en la región de saturación. La ecuación paraeste parámetro viene dada por:

    λ = λ0 + λ1Vgcci + λ2Vgcci2 + λ3Vdcci + λ4Vdcci

    2 (4.36)

    Volviendo a la expresión (4.31), el parámetro α del término de la tangentehiperbólica controla la región lineal. La diferencia con respecto a modelos an-teriores es que el argumento de la tangente hiperbólica contiene a α divididopor el parámetro Idss. La variación de α viene dada por:

    α = α0 + α1Vgcci + α2Vgcci2 + α3Vdcci + α4Vdcci

    2 (4.37)

    4.6. Modelo de Deng

    Deng, partiendo del modelo de Angelov, propone en [28] un nuevo modeloque tiene en cuenta características exclusivas de un MOSFET de GaN. Setrata de un modelo electrotérmico que contempla los efectos de la tempera-tura hasta un punto de tensión umbral y de degradación de la transconduc-tancia, estando la corriente de drenador en región lineal y la capacidad depuerta cercana a la región de corte. La mayoría de los parámetros del mode-lo varían con la temperatura, incluyendo la tensión umbral, la corriente dedrenador y la corriente y capacidad de puerta.

    52

  • 4. MODELADO DE GRAN SEÑAL

    La corriente de drenador Ids se de�ne de acuerdo al modelo de Angelov:

    Ids = Ipk0 (1 + tanhψ) tanh (αVds) [1 + λVds + LSB0 exp (Vdg − V TR)](4.38)

    donde

    ψ = P1m (Vgs − Vpkm) + P2(Vgs − Vpkm)2 + P3(Vgs − Vpkm)3 (4.39a)

    P1m = P1

    [1 +

    B1

    cosh2 (B2Vds)

    ](4.39b)

    Vpkm = Vpks −DV PKS +DV PKS tanh (αsVds)− LSB2(Vgd − V TR)2

    (4.39c)

    α = αR + αs (1 + tanhψ) (4.39d)

    Por tanto, los parámetros que deben ser ajustados son: Ipk0, Vpks, DVPKS,P1, P2, P3, B1, B2, αR, αs, λ, LSB0, LSB2 y VTR.

    Las corrientes de puerta se modelan como sigue:

    Igs = IG0 exp

    (−EAkT

    )[exp

    (qVgsNkT

    )− 1]

    (4.40a)

    Igd = IG0 exp

    (−EAkT

    )[exp

    (qVgdNkT

    )− 1]

    (4.40b)

    donde k es la constante de Boltzman, T es la temperatura de la unión y qes la carga del electrón, siendo los parámetros a ajustar IG0, EA y N.

    Las capacidades de puerta Cgs y Cgd se representan a partir de los modelosde carga de Angelov. Deng añade además un término adicional Cgs1 paraajustar el pico de Cgs cerca de la región de corte:

    Qgs = CgspiVgsc + Cgs0[(φ1 + Lc1 −Qgs0)

    1− P111 + tanhφ2P11

    + 2P111Vgsc

    ]− Cgs1 tanh [P5 (Vgsc − Vgss)] (4.41)

    donde Vgsc es el voltaje puerta-fuente intrínseco tras sustraer la caída detensión en los terminales de las resistencias e inductancias, y:

    φ1 = P10 + P11Vgsc + P111Vds (4.42a)

    φ2 = P20 + P21Vds (4.42b)

    Lc1 = ln [coshφ1] (4.42c)

    Qgs0 = P10 + P11Vds + Lc10 (4.42d)

    Lc10 = ln [cosh (P10 + P111Vds)] (4.42e)

    53

  • Ana María Benítez Lara

    El modelo de carga para Cgd permanece inalterable con respecto al delmodelo de Angelov:

    Qgd = CgdpiVgdc + Cgd0

    [(φ4 + Lc4 −Qgd0) (1− P111 + tanhφ3)

    P41+ 2P111Vgdc

    ](4.43)

    donde Vgdc es el voltaje puerta-drenador intrínseco tras sustraer la caída detensión en los terminales de las resistencias e inductancias, y:

    φ3 = P30− P31Vds (4.44a)φ4 = P40 + P41Vgdc − P111Vds (4.44b)Lc4 = ln [coshφ4] (4.44c)

    Qgd0 = P40− P11Vds + Lc40 (4.44d)Lc40 = ln [cosh (P40− P111Vds)] (4.44e)

    Los parámetros que deben ser ajustados en este caso son: Cgspi, Cgs0,Cgs1, Cgs, Cgdpi, Cgd0, P10, P11, P111, P20, P21, P30, P31, P40, P41, P5 yVgss.

    En correspondencia con lo expuesto en la sección 2.2.3, para incluir carac-terísticas electrotérmicas, al circuito de la �gura 4.1 se le podría añadir unsubcircuito como el de la �gura 4.2 formado por una red RC-paralelo y quepuede usarse para calcular el incremento de temperatura ambiente (∆T ).

    ∆T = RthPdis (4.45a)

    Cth =τ

    Rth(4.45b)

    Figura 4.2: Subcircuito electrotérmico.

    donde Rth es la resistencia térmica, Pdis es la potencia disipada, Cth es lacapacidad térmica y τ es una constante de tiempo térmica.

    Los parámetros de este modelo electrotérmico cumplen una relación linealcon la temperatura que puede modelarse de la siguiente manera:

    Par(T ) = Par(0) (1 + TPar∆T ) (4.46)

    54

  • 4. MODELADO DE GRAN SEÑAL

    donde Par es el valor del parámetro a temperatura ambiente y TPar es elcoe�ciente lineal con la temperatura.

    4.7. Identi�cación de modelos

    Para la identi�cación de los modelos descritos en la sección anterior sehace necesario el uso de cálculos complejos a través de métodos numéricos,que no serían posibles sin una herramienta computacional adecuada. YaCurtice y Ettenberg resaltan en [25] la importancia de estas herramientaspresentando el diagrama de �ujo del programa para el análisis no lineal deun FET de GaAs para el diseño de circuitos de ampli�cadores de potencia.El diagrama de �ujo puede observarse en la �gura 4.3, donde uno de losbloques indica el uso de métodos newtonianos para estimar las soluciones encaso de ser necesaria la minimización de errores.

    Figura 4.3: Diagrama de �ujo del funcionamiento del programa usado por Curticey Ettenberg [25].

    Estos métodos numéricos son de gran importancia para la resolución deecuaciones del modelo y su implementación en herramientas CAD se haceimprescindible a la hora de encontrar una solución. La mayoría de estos

    55

  • Ana María Benítez Lara

    métodos se basan en técnicas iterativas donde, a partir de una solucióninicial x0, se halla una sucesión

    {xn}de aproximación a la solución de la

    ecuación no lineal bajo ciertos márgenes de error. Algunas cuestiones que seplantean acerca del comportamiento de un método iterativo son la velocidadde convergencia con la que la sucesión converge a una solución y el errorcometido al aproximar dicha solución.

    Actualmente existen varios métodos iterativos que sirven para resolverestos modelos de ecuaciones no lineales que describen el comportamiento delos dispositivos bajo estudio, y que se basan en la resolución del método demínimos cuadrados, entre ellos, el más conocido podría ser el de Newton-Raphson. Una modi�cación posterior a este método es el de Levenberg-Marquardt. El método de Newton resulta e�caz, pero al ser necesario elcálculo de jacobianos y la evaluación de sucesivas derivadas de la función nolineal de orden creciente, se convierte en un proceso costoso y, en ocasiones,inviable, por lo que a veces su utilidad podría verse limitada. Todos estosmétodos se encuentran en la base de la técnica más popular para el análisis decircuitos no lineales de alta frecuencia: el balance armónico [29]. No obstante,dado el alcance del presente proyecto, no se discutirán aquí los métodos debalance armónico, sino que se hará una breve introducción a las técnicas deresolución de sistemas de ecuaciones no lineales, que son esenciales para laidenti�cación de modelos de gran señal.

    4.7.1. Método de mínimos cuadrados lineal

    Este método es usado en el cálculo computacional para llevar a cabo elajuste de un modelo lineal a los datos medidos de manera experimental.Para ilustrar este método supongamos que tenemos n puntos que pueden sermodelados por un polinomio de primer grado como el siguiente [30]:

    y = p1x+ p2 (4.47)

    Para resolver esta ecuación hallando el valor de los coe�cientes p1 y p2 sede�ne S como un sistema de n ecuaciones lineales con dos incógnitas. Si nes mayor que el número de incógnitas, entonces el sistema estaría sobrede-terminado.

    S =n∑1

    (yi − (p1xi + p2))2 (4.48)

    El proceso de mínimos cuadrados minimiza la suma de los cuadradosde los residuos por lo que los coe�cientes se calculan diferenciando S con

    56

  • 4. MODELADO DE GRAN SEÑAL

    respecto a cada parámetro e igualando a cero.

    ∂S/∂p1 = −2n∑1

    xi (yi − (p1xi + p2)) = 0 (4.49a)

    ∂S/∂p2 = −2n∑1

    (yi − (p1xi + p2)) = 0 (4.49b)

    Los parámetros p1 y p2 generalmente se representan por b1 y b2. Así setiene:

    n∑1

    xi (yi − (b1xi + b2)) = 0 (4.50a)

    n∑1

    (yi − (b1xi + b2)) = 0 (4.50b)

    Estas ecuaciones pueden reescribirse como:

    b1

    n∑1

    xi2 + b2

    n∑1

    xi =n∑1

    xiyi (4.51a)

    b1

    n∑1

    xi + nb2 =n∑1

    yi (4.51b)

    Resolviendo para b1:

    b1 =n∑n

    1 xiyi −∑n

    1 xi∑n

    1 yi

    n∑n

    1 xi2 − (

    ∑n1 xi)

    2 (4.52)

    Sustituyendo el valor obtenido para b1 se resuelve b2 como:

    b2 =1

    n

    (n∑1

    yi − b1n∑1

    xi

    )(4.53)

    Como se puede ver, la estimación de los coe�cientes p1 y p2 requiere sóloalgunos cálculos simples. Si se extiende este ejemplo a polinomios de mayorgrado se seguiría el mismo procedimiento aunque sería algo más tedioso yaque se tendría una ecuación adicional por cada término lineal que se añadieraal modelo.

    Considerando matrices, los modelos vienen dados por la siguiente fórmula:

    y = Xβ + ξ (4.54)

    57

  • Ana María Benítez Lara

    donde y es el vector de salidas de n �las, β es el vector de coe�cientes de m�las, X es la matriz del modelo de dimensiones n × m y ξ es el vector deerror de n �las.

    Para un polinomio de primer grado, las n ecuaciones con dos incógnitasse expresan en términos de y, X y β como:

    y1y2y3...yn

    =x11x21x31...xn1

    ×[p1p2

    ](4.55)

    La solución de mínimos cuadrados es un vector b, el cual estima el vectorde coe�cientes β. Las ecuaciones vienen dadas por:(

    XTX)b = XTy (4.56)

    donde XT es la traspuesta de la matriz X. Resolviendo para b se tiene:

    b =(XTX

    )−1XTy (4.57)

    Sustituyendo b en la ecuación del modelo se obtiene el valor de �y:

    ŷ = Xb = Hy (4.58)

    donde H = X(XTX

    )−1XT .

    El acento circun�ejo sobre y indica que esta toma un valor estimado apartir de un modelo de predicción.

    Los residuos vienen dados por:

    r = y − ŷ = (1−H) y (4.59)

    4.7.2. Método de mínimos cuadrados no lineal

    Este método es usado cuando se necesita hacer un ajuste de un modelono lineal a datos medidos de manera experimental. Por modelo no linealse entiende aquel que está compuesto por funciones no lineales que contie-nen coe�cientes. Las funciones gaussianas, los cocientes de polinomios o lasfunciones de potencias son ejemplos de funciones no lineales [30].

    58

  • 4. MODELADO DE GRAN SEÑAL

    En forma matricial, los modelos no lineales vienen dados por:

    y = f (X, β) + ξ (4.60)

    donde y es el vector de salidas de n �las, f es una función de X y β, β es elvector de coe�cientes de m �las, X es la matriz del modelo de dimensionesn×m y ξ es el vector de error de n �las.

    Los modelos no lineales presentan una mayor di�cultad que los lineales yaque los coe�cientes no pueden estimarse usando técnicas matriciales simples.Por tanto, se hace necesario el uso de métodos iterativos de aproximación,que generalmente siguen los pasos siguientes:

    1. Estimar un valor inicial para cada coe�ciente. Las herramientas CADrealizan, unas veces, una aproximación heurística que proporciona va-lores acertados y otras, eligen valores aleatorios comprendidos en unintervalo [0, 1].

    2. Realizar el ajuste de las curvas a los coe�cientes. El valor de y vienedado por ŷ = f (X, b) y requiere del cálculo del jacobiano de f de�nidocomo una matriz en derivadas parciales con respecto a los coe�cientes.

    3. Ajustar los coe�cientes y comprobar si el ajuste se puede mejorar. Laprecisión del ajuste dependerá del algoritmo iterativo empleado.

    4. Iterar el proceso volviendo al paso 2 hasta que el ajuste cumpla con loscriterios de convergencia especi�cados.

    4.7.3. Método de Newton para funciones de una variable

    Se considera una raiz α � (a, b) de una función f, es decir, f (α) = 0. Elmétodo de Newton trata de encontrar una solución que converja a α usandoaproximaciones lineales a través de la serie de Taylor de la función f en α.Por tanto, se tiene que:

    f (α) = 0 = f (x) + f′(x) (α− x) + f ′′ (ξ) (α− x)2/2 (4.61)

    donde ξ es un punto intermedio entre α y x. Además, si x está lo su�ciente-mente cercana a α como para cumplirse que:

    (α− x)2 � |α− x| (4.62)

    podría asumirse que:

    f (α) = 0 ≈ f (x) + f ′ (x) (x− α) (4.63)

    59

  • Ana María Benítez Lara

    Y si se divide por f′(x) se llega a:

    (α− x) ≈ − f (x)f ′ (x)

    ⇒ α ≈ x− f (x)f ′ (x)

    (4.64)

    Es decir, la relación anterior muestra que si x es una buena aproximaciónde α, la expresión x − f(x)

    f ′(x)debería ser una aproximación aún mejor. Por

    tanto, se genera la sucesión{xn}, a partir de x0, que viene de�nida por la

    siguiente fórmula recursiva:

    xn+1 = xn −f (xn)

    f ′ (xn), n ≥ 0 (4.65)

    la cual requiere el cálculo de la función y su derivada en cada punto.

    Este método tiene convergencia local, es decir, converge siempre que x0esté lo su�cientemente cerca de α. Por otro lado, la convergencia es tambiéncuadrática, cumpliéndose:

    |xn+1 − α| ≈ C|xn − α|2, n � N (4.66)

    donde C es una constante independiente de n.

    En la �gura 4.4 se puede ver una descripción grá�ca de este métododesde el punto de vista geométrico. Primero se calcula la recta tangente ala curva y = f (x) en el punto de primera aproximación x0 y la intersecciónde dicha recta tangente con el eje x es x1. Después este proceso se repiteiterativamente.

    Figura 4.4: Descripción del método de Newton [31].

    4.7.4. Método de Newton para sistemas de ecuaciones no lineales

    Se considera ahora una raíz α de una función f (α) = 0, como en el casoanterior, y un vector x �Rm lo su�cientemente cercano a α. En este caso, se

    60

  • 4. MODELADO DE GRAN SEÑAL

    tiene que:

    f (α) = 0 = f (x) +Df (x) (α− x) +D2f (x, α) (α− x, α− x) (4.67)

    donde Df (x) es la matriz diferencial o jacobiana de f en x.

    Df (x) = [∂f (x)/∂x1, ..., ∂f (x)/∂xm] =

    ∂f1 (x)/∂x1 ... ∂f1 (x)/∂xm... ... ...∂fm (x)/∂x1 ... ∂fm (x)/∂xm

    (4.68)

    y las m componentes de D2f (x, α) (α− x, α− x) vienen dadas por:

    (α− x)T(∫ 1

    0

    (1− s)D2fj ((1− s)x+ sα) ∂s)

    (α− x) , j = 1, ...,m

    (4.69)

    siendo D2fj (x) la matriz Hessiana del campo escalar fj

    D2fj (x) =

    ∂fj (x)2/∂x1x1 ... ∂fj (x)2/∂x1xm... ... ...∂fj (x)

    2/∂xmx1 ... ∂fj (x)2/∂xmxm

    (4.70)Como en el caso escalar, si x está lo su�cientemente cercana a α como paraque (α− x)2 � |α− x|, se puede suponer que:

    f (α) = 0 ' f (x) +Df (x) (α− x) (4.71)

    Multiplicando por la inversa de la matriz jacobiana J = Df (x) se tiene que:

    (α− x) ≈ −J−1f (x)⇒ α ≈ x− J−1f (x) (4.72)

    Esta aproximación es la base del método de Newton. En concreto, si se partede x0, se busca generar la sucesión:

    xn+1 = xn −Df(xn)−1f (xn) , n ≥ 0 (4.73)

    Al igual que el método escalar, este es localmente convergente y de ordencuadrático.

    4.7.5. Método de descenso

    Al igual que los anteriores este método es iterativo, es decir, parte de unpunto inicial x0 y genera una secuencia de parámetros

    {xn}que, en caso de

    converger, se acerca a un mínimo local x. Los métodos de descenso generanuna secuencia de parámetros tal que, [32]

    f (xn+1) < f (xn) (4.74)

    61

  • Ana María Benítez Lara

    Uno de los métodos de descenso más conocidos es el de Gauss-Newton queconsiste en tomar la aproximación lineal de f:

    f (x+ h) ≡ f (x) + J (x)h (4.75)

    donde J es el jacobiano de la función f.

    A continuación, introduciendo esta ecuación en la función de costo seobtiene:

    f (x+ h) ≈ l (h) ≡ f (x) + hTJTf (x) + 12hTJTJh (4.76)

    Con esto, Gauss-Newton propone la dirección de descenso hgn tal que,(JTJ

    )hgn = −JTf (4.77)

    Y ahora, el nuevo conjunto de parámetros sería xn+1 = xn + hgn.

    4.7.6. Método de Levenberg-Marquardt

    El método de Levenberg-Marquardt pertenece a la familia de los métodosde descenso, aunque se considera como un método mixto que combina la ro-bustez del método de descenso con la e�ciencia local del método de Newton.Al igual que Gauss-Newton, toma una aproximación lineal del modelo y lasiguiente dirección de descenso [32]:(

    JTJ + βI)hlm = −JTf, β ≥ 0 (4.78)

    Analizando la expresión anterior puede observarse que:

    1. para valores grandes de β,

    hlm ≈ −1

    βJTf (4.79)

    es decir, el paso es pequeño en la dirección de máximo descenso, lo quees bueno para iteraciones lejanas al mínimo local.

    2. para valores pequeños de β, hlm ≈ hgn, lo cual es bueno para iteracionescercanas al mínimo.

    Como se puede apreciar, β modi�ca tanto el módulo como la dirección dedescenso. Además, la elección del valor inicial para el parámetro de amorti-guamiento debe contener cierta relación con el valor absoluto de la matrizA0 = J(x0)

    TJ (x0), por ejemplo:

    β = τ ·maxi{aii

    (0)}

    (4.80)

    62

  • 4. MODELADO DE GRAN SEÑAL

    siendo τ generalmente un número pequeño.

    Por tanto,a medida que el algoritmo avanza, el valor de µ se va actuali-zando mediante la siguiente ecuación:

    ρ =f (x)− f (x+ hlm)l (0)− l (hlm)

    (4.81)

    donde un valor grande de ρ indica que l (hlm) es una buena aproximación def (x+ hlm), y por tanto β puede disminuirse de forma considerable, pudien-do parecerse más al algoritmo de Gauss-Newton al acercarse al mínimo. Sinembargo, si ρ toma un valor pequeño, la aproximación es mala y hay quedar pasos muy pequeños en la dirección de descenso de mayor pendiente.

    63

  • Ana María Benítez Lara

    64