OpenAccess Yoneyama
OpenAccess Yoneyama
OpenAccess Yoneyama
YONEYAMA
ENGENHARIA DE CONTROLE
Teoria e prática
fe
Esta obra busca oferecer aos estudantes e profissionais da área de Sistemas e
ENGENHARIA DE CONTROLE
Controle uma visão ampla, moderna e integrada do tema de modo simples, po-
rém sem prescindir de rigor formal. São apresentados os aspectos práticos rele-
vantes na prática com uma sólida base teórica que permite aprofundar o domínio
dos conceitos envolvidos. Cada tópico é ilustrado com exemplos numéricos e
complementados com exercícios de variadas dificuldades. Alguns detalhes mais
intrincados das ferramentas utilizadas nos projetos de controladores podem ser
encontrados na forma de apêndices.
fe
openaccess.blucher.com.br
Engenharia de controle
Teoria e prática
Takashi Yoneyama
CONSELHO EDITORIAL
André Costa e Silva
Cecilia Consolo
Dijon de Moraes
Jarbas Vargas Nascimento
Luis Barbosa Cortez
Marco Aurélio Cremasco
Rogerio Lerner
Takashi Yoneyama
ENGENHARIA DE CONTROLE
Teoria e prática
Engenharia de controle: teoria e prática
© 2022 Takashi Yoneyama
Editora Edgard Blücher Ltda.
Editora Blucher
Rua Pedroso Alvarenga, 1245, 4º andar
CEP 04531-934 – São Paulo – SP – Brasil
Tel.: 55 11 3078-5366
contato@blucher.com.br
www.blucher.com.br
I Introdução 7
1 Conceitos e definições 9
1.1 Conceitos, definições e notação . . . . . . . . . . . . . . . . . . 9
1.2 Um exemplo intuitivo de projeto . . . . . . . . . . . . . . . . . 12
1.3 Público-alvo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Panorama histórico 19
2.1 IFAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Livros-textos pioneiros . . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Controle no Brasil . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4 Medalhistas IEEE . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Modelos dinâmicos 41
3.1 Modelos de tempo contı́nuo . . . . . . . . . . . . . . . . . . . . 43
3.2 Modelagem usando leis fı́sicas . . . . . . . . . . . . . . . . . . . 46
3.3 Validação de modelos . . . . . . . . . . . . . . . . . . . . . . . 59
3.4 Incertezas em modelos . . . . . . . . . . . . . . . . . . . . . . . 59
3.5 Solução de EDOs lineares . . . . . . . . . . . . . . . . . . . . . 60
3.6 Método da média (averaging) . . . . . . . . . . . . . . . . . . . 68
3.7 Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.8 Estabilidade de sistemas LTI . . . . . . . . . . . . . . . . . . . 78
3.9 Controlabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.10 Observabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.11 Simulação de sistemas dinâmicos . . . . . . . . . . . . . . . . . 89
3.12 Sistemas de segunda ordem . . . . . . . . . . . . . . . . . . . . 98
vii
viii Engenharia de controle
VI Apêndices 453
13 Apêndices 455
13.1 Apêndice A - Equação de Euler-Lagrange . . . . . . . . . . . . 455
13.2 Apêndice B - Iteração de Picard . . . . . . . . . . . . . . . . . 459
13.3 Apêndice C - Exponencial de matriz . . . . . . . . . . . . . . . 462
xi
Dizia Monteiro Lobato que um paı́s se faz com homens e livros. Com essas
palavras em mente, foi para mim um privilégio ter sido convidado para redi-
gir o prefácio desta obra, redigida por dois colegas de destacada atuação na
prática da Engenharia de Controle e na formação continuada de novos profis-
sionais para o paı́s. O texto é de agradável leitura, com riqueza de exemplos,
ilustrações claras e exposição didática apoiada por rigor matemático. Notas
históricas também são incluı́das de forma muito oportuna. O conteúdo abarca
o uso de modelos lineares e também diversas ferramentas para tratamento de
não linearidades, percorrendo com elegância tanto o controle a tempo contı́nuo
quanto o controle empregando amostragem. Também são discutidos vários as-
pectos de relevância para um projeto de engenharia, desde as análises iniciais
até o comissionamento. Nesse sentido, será de valia para profissionais e estu-
dantes, de graduação e pós-graduação, nos diversos campos que se relacionam
com esta transversal área de controle. Como um todo, trata-se de excelente
livro, certamente uma valiosa contribuição para a literatura nacional.
1
Apresentação
Esta obra foi concebida com vistas a propiciar uma visão integrada do pro-
blema de projeto de sistemas de controle, eficazes na prática e solidamente
respaldada por princı́pios fundamentais.
Busca-se apresentar primordialmente os variados enfoques amplamente utili-
zados na prática rotineira de projeto de controladores, atentando-se, porém,
a aspectos tecnológicos que permeiam o meio industrial e também sem negli-
genciar o rigor formal.
O texto inclui resultados relativamente modernos da área de Sistemas e Con-
trole, tais como os esquemas de controle adaptativo e de controle robusto que
são métodos usuais para mitigar incertezas, sem descuidar, no entanto, dos
chamados clássicos.
Um capı́tulo próprio foi preparado para prover uma visão holı́stica de projeto
de controladores seguindo preceitos da Engenharia de Sistemas.
Em vista da atualidade, são cobertos alguns aspectos relativos a controle por
computador, bem como de uso de sistemas baseados em conhecimento em pro-
blemas de controle.
A apresentação dos diversos métodos de análise e projeto requer apenas fer-
ramentas estudados nos cursos básicos de Engenharia, ou seja, Cálculo Dife-
rencial e Integral, Álgebra Linear e Funções de Variável Complexa.
Uma porção significativa do material desse livro foi concebido e utilizado em
um número de disciplinas da área de Sistemas e Controle do ITA e de outras
Instituições.
Takashi Yoneyama
3
Agradecimentos
Takashi Yoneyama
5
Parte I
Introdução
7
1
Conceitos e definições
9
10 Engenharia de controle
da porta.
• Muitas vezes é utilizado o termo automático quando se refere a sistemas
de controle. Em princı́pio, automático é aquele que requer reduzida in-
tervenção do operador humano, em contraposição ao termo manual. Por
exemplo, um sistema de ar condicionado mantém regulada a temperatura
do recinto, apesar de mudanças climáticas ou alterações do número de
pessoas presentes na sala. Por outro lado, um ventilador simples requer
que o usuário ajuste a velocidade (baixa, média, baixa) através de uma
chave seletora. Com o advento de ferramentas de inteligência artificial
e desenvolvimento de sistemas sofisticados de decisão, tem-se hoje em
dia os sistemas autônomos que realizam tarefas complexas sem a interfe-
rência direta do operador humano. Um exemplo clássico é o de veı́culos
autônomos que dispõem de mecanismos de localização, planejamento de
rotas, desvio de obstáculos imprevistos e pedestres.
Genericamente, um problema de controle consiste de dois ingredientes prin-
cipais:
1. o sistema a ser controlado; e o
2. o comportamento desejado a ser obtido mediante as ações de controle.
d2 X
F −D =m (1.1)
dt2
e, assumindo que as forças F e D podem ser aproximadas na condição de
operação pretendida por
F = αU 2 (1.2)
!2
dX
D = β (1.3)
dt
!2
dX 2
β = αUnom (1.5)
dt
ou
α
r
Vnom = Unom (1.6)
β
Adicionando-se um pequeno sinal u a Unom (ou seja, |u| ≪ |Unom | ), o carrinho
responde com uma alteração x(t) em relação a X(t) e, definindo v = dx dt , a
equação 1.4 pode ser reescrita como
d2
m (X + x) = α (Unom + u)2 − β (Vnom + v)2 (1.7)
dt2
Notando que u2 é um termo de segunda ordem, u2 ≪ Unom
2 + 2Unom u, e
pode-se escrever
d2
X d2 x 2 2
m 2 + m 2 =
αU
nom + 2αUnom u − nom − 2βVnom v
βV (1.10)
dt dt
em que os cancelamentos ocorrem em vista de 1.4.
Logo, o modelo linearizado do carrinho é
d2 x
m = −2βVnom v + 2αUnom u (1.11)
dt2
d2 x dv
Lembrando que dt2
= dt e adotando a notação agrupada
·
2β X nom
a = − (1.12)
m
2α (Unom )
b = (1.13)
m
obtém-se o modelo para a dinâmica da velocidade do veı́culo em função de
pequenas alterações na velocidade de rotação da hélice, dado por
dv
= av + bu (1.14)
dt
Conceitos e definições 15
u = −K(Vnom − V ) (1.15)
= −Kv (1.16)
Nota-se na 1.4 que, embora o carro responda à perturbação que foi aplicada,
este retorna ao valor de referência pela ação do controlador. Neste contexto,
diz-se que se tem um sistema automático de controle, ou seja, sem a intervenção
de um operador humano.
1.3 Público-alvo
Esta obra busca explorar os conceitos e os métodos utilizados em aplicações
práticas da teoria de controle, eventualmente expandindo o conteúdo visto em
cursos tradicionais da área.
Embora o domı́nio das noções básicas da teoria de controle facilite a leitura do
presente texto, tomou-se o cuidado para limitar os pre-requisitos para uma boa
compreensão do material a assuntos vistos, em geral, nos primeiros anos dos
cursos de Ciências Exatas, tais como Cálculo Diferencial e Integral, Equações
Diferenciais Ordinárias, Álgebra Linear e Cálculo em uma Variável Complexa.
Noções de programação de computador são também muito úteis.
O enfoque básico neste livro para abordar os problemas de controle é buscar
um tratamento inicial com modelos simplificados (tipicamente modelos linea-
Conceitos e definições 17
1.4 Exercı́cios
1.4.1 Exercı́cio
Cite 10 sistemas de controle que estão presentes no âmbito domiciliar (por
exemplo, controle de temperatura do forno elétrico, velocidade de rotação do
seu toca-discos, regulador de tensão do no-break, dimmer etc.)
1.4.2 Exercı́cio
Cite 10 sistemas de controle que estão presentes no âmbito social (por exem-
plo, pesca não predatória, plano de previdência social, dinâmica populacional,
controle de tráfego urbano, controle do câmbio etc.)
1.4.3 Exercı́cio
Escolha um sistema industrial com o qual está familiarizado e proponha que
variáveis seriam interessantes como entradas, como saı́das e quais são as po-
tenciais perturbações. Procure estabelecer alguns comportamentos que seriam
buscados desse sistema, mediante ações de controle.
2
Panorama histórico
19
20 Engenharia de controle
Dispositivos antigos
Os dispositivos antigos eram construı́dos, em geral, de modo artı́stico e arte-
sanal, baseado na capacidade inventiva de quem os concebeu. Um exemplo
clássico é o Sistema Automático de Abertura de Portas atribuı́do ao matemá-
tico Heron de Alexandria (c.10-c.70 AD). Consistia de um vaso de pressão,
conectado ao altar da chama. Quando se acendia a chama, a variação de
pressão devido à queima movimentava água de um compartimento a outro, de
modo a obter uma tração mecânica para abrir o portão. Por curiosidade, em
1931, Horace H. Raymond e Sheldon S. Roby projetaram e obtiveram uma
patente de uma porta automática (Apparatus for Operating Doors, 23 out
1934, n. US1978093A). Essa porta foi instalada em um restaurante de West
Haven para facilitar os garçons no atendimento aos clientes. Hoje em dia, as
portas automáticas são largamente difundidas.
Observação: Atribui-se a Heron a invenção do aeolipile, que, em princı́pio,
poderia ser considerado como uma turbina a vapor ou máquina a vapor. A
invenção de máquinas a vapor constitui um importante marco na história da
teoria de controle, mas que se tornou efetivo no século XVIII. Esse detalhe
ilustra a dificuldade de se organizar uma linha de tempo.
Panorama histórico 21
Regulação de temperatura
O termostato bimetálico, utilizado ainda nos dias de
hoje, foi inventado em 1830 por Andrew Ure (1778-
1857). Consiste de duas lâminas de metal com co-
eficientes de dilatação diferentes coladas. Quando a
temperatura aumenta, a dilatação maior de uma das
lâminas faz o conjunto envergar e esse movimento
pode ser utilizado, por exemplo, para ligar ou des-
ligar o circuito de aquecimento. Em 1609, Cornelis
Jacobszoon Drebbel (1572-1633) concebeu uma in-
cubadora de ovos com termostato baseado na dila- Figura 2.1: Ex-
tação do mercúrio para regular a temperatura. A traı́do da wikipe-
estratégia de controle liga-desliga é encontrada em dia.org/wiki/Aeolipile.
um grande número de aplicações, sendo que termos-
tatos bimetálicos continuam ainda em uso, apesar de chaves mais modernas
baseadas em relés e componentes semicondutores.
Atualmente, o controle de temperatura está presente na estufa, no fogão, no
ar-condicionado, no ferro elétrico, na geladeira, no arrefecimento de moto-
res de carros, no cooler de microprocessadores e muitos outros dispositivos e
equipamentos.
Fontes de energia
Para se atuar sobre um sistema fı́sico para
que esse apresente o comportamento desejado,
necessita-se de fontes de energia. Antes do
advento de máquinas a vapor, a energia me-
cânica para bombeamento de água e moenda
de grãos, por exemplo, era obtida através de
cataventos e rodas d’água. Mecanismos enge-
nhosos como a hélice de Edmund Lee (1745)
permitiam que os cataventos ficassem alinha- Máquina a Vapor. Ex-
dos com a direção do vento. traı́do de www.deutsches-
museum.de/en/exhibitions/.
Thomas Newcomen (1664-1729) projetou, em
1712, a primeira máquina prática que quei-
mava combustı́vel para produzir movimento mecânico utilizado no aciona-
mento de bombas hidráulicas (cilindro-pistão), melhorando o projeto idea-
lizado por Thomas Savery (c.1650-1715). As bombas eram utilizadas para
drenagem de minas.
Denis Papin (1647-1713) inventou em 1681 um mecanismo de segurança para
22 Engenharia de controle
Medida do tempo
A medida do tempo é de grande importância no con-
trole do plantio e da colheita, na navegação marı́tima,
no monitoramento de processos quı́micos, no estudo da
evolução clı́nica de doenças, no controle de processos cu-
linários e muitas outras atividades.
Acredita-se que um dos primeiros relógios era solar base-
ado no movimento da sombra de algum obelisco ou uma
haste, ao longo do dia.
A medida de intervalos maiores de tempo era baseadas
em mapas estrelares. Por exemplo, no Brasil, vê-se a
constelação de Órion no verão e a de Escorpião no in-
verno. Os relógios de água (clepsydras) apareceram em
torno de 1.500 BC e relacionavam o tempo decorrido com
o nı́vel de água de um vaso em que se despejava água a Figura 2.2: Clepsi-
um fluxo constante. As ampulhetas forneciam uma me- dra.
dida do tempo baseado na passagem de areia de um compartimento a outro,
Panorama histórico 23
Avanços da Matemática
No enfoque quantitativo da Teoria de Controle, a Matemática desempenha um
papel primordial.
Aqui são mencionados apenas três exemplos de
ferramentas amplamente utilizadas nos projetos de
controladores para ilustrar a importância da mate-
mática:
• funções de transferência
• equação de Euler-Lagrange
Eletricidade
Ányos István Jedlik (1800-1895) é considerado o inventor de motores DC e em
1827, construiu o que ele chamou de auto-rotor eletromagnético. Um motor
Panorama histórico 25
realmente operacional foi construı́do por Moritz Hermann (ou Boris Semyo-
novich von Jacobi, 1801-1874) em 1834. O hoje em dia onipresente motor
de indução com gaiola de esquilo foi inventado por Mikhail Osipovich Dolivo-
Dobrovolsky (1861-1919) em 1889.
Aplicações navais
Os desafios trazidos pela indústria naval contribuı́ram significativamente para
o desenvolvimento da Teoria de Controle. Cornelis Jacobszoon Drebbel (1572-
1633) já havia projetado, em torno de 1620, o que é considerado o primeiro
submarino do mundo.
Jean Joseph Léon Farcot (1824-1908) é considerado um dos pioneiros no pro-
jeto de servomecanismos, tendo desenvolvido mecanismos para movimentar
lemes de navio de várias toneladas a partir do comando do timoneiro. (Far-
cot, J.J.L. Le servo-moteur ou Moteur Asservi, J. Baudry, 1873).
Panorama histórico 27
Aeronáutica
Em 8 de agosto de 1709, o balão de ar quente construı́do por Bartolomeu de
Gusmão, alçou na corte de Dom João V de Portugal, em Lisboa.
Em 24 de setembro de 1852, Baptiste Jules Henri Jacques Giffard (1825-1882)
voou 27 km entre Paris e Elancourt no seu dirigı́vel propelido por uma máquina
a vapor.
Júlio César Ribeiro de Souza
(1843-1887) concebeu o dirigı́vel Le
Victoria (homenagem à esposa, Vic-
toria Hippolita do Valle), que pos-
suı́a um formato dissimétrico favorá-
vel para avançar contra o vento.
Em 1890, Clément Ader (1841-
1925), construiu Eole, um averoplano
equipado com um motor a vapor.
Ader conseguiu decolar, mas não
conseguiu controlar a Eole.
Alberto Santos Dumont (1873-1932), Figura 2.6: Voo do Santos Dumont
no seu dirigı́vel No. 5, ganhou o prê- no seu 14-bis. Extraı́do de wikipe-
mio Deutsch de la Meurthe do Aero dia.org/wiki /Voo do 14 bis.jpg.
28 Engenharia de controle
Foguetes e satélites
Em 1960, Charles Stark “Doc” Draper (2 de outubro de 1901-25 de julho
de 1987) inventou o sistema de navegação inercial utilizando giroscópios e
acelerômetros, muito utilizados ainda hoje em navegação, apesar do advento
de dispositivos como giro-LASER, GPS e outras invenções modernas. Em
1953, Draper e sua equipe puderam testar o sistema de navegação inercial
Space Inertial Reference Equiment (SPIRE) em um bombardeiro B-29.
Assume-se que o foguete foi inventado por volta de
1000 DC, na forma de flechas propulsionados por pól-
vora. Em torno de 1405 DC, Konrad Kyeser (1366-?)
escreveu o livro Bellifortis, sobre a tecnologia mili-
tar, e incluiu descrições de foguetes.
Várias variantes de foguetes e pirotécnicos foram
descritas em Artis Magnae Artilleriae pars prima
(Grande arte de artilharia, parte I), de Kazimierz
Siemienowicz (c. 1600-c. 1651), impresso em Ams-
terdam em 1650.
Em 16 de março de 1926 foi lançado o primeiro fo-
guete de combustı́vel lı́quido projetado por Robert Figura 2.7: Satélite
Hutchings Goddard (1882-1945). In 1943, iniciou-se Sputnik 1, obtido de
a produção do famoso foguete V-2 (Vergeltungswaffe wikipedia.org/wiki.
2 ou arma de vingança 2) pela equipe coordenada
por Wernher Magnus Maximilian Freiherr von Braun
(1912-1977), que permitia atingir alvos a 300 km carregando 1.000 kg de ex-
plosivos.
O primeiro satélite artificial, o Sputnik 1, foi lançado do cosmódromo de Bai-
konur no Cazaquistão, pela União Soviética, em 4 de outubro de 1957. Era
uma esfera de 58 cm de diâmetro e 83.6 kg de massa.
Em 12 de abril de 1961 foi lançado o Vostok I, levando o cosmonauta Yuri
Alekseyevich Gagarin (1934-1968) para um voo orbital de 48 min ao redor da
Terra.
No Natal de 1968, Frank Frederick Borman II (1928-), James Arthur Lovell
Jr. (1928-) e William Alison Anders (1933-) circum-navegaram a Lua a bordo
do Apollo 8. Em 20 de julho de 1969, Neil Alden Armstrong (1930-2012) pisou
no solo lunar, durante a missão do Apollo 11, cunhando a famosa frase: “Um
pequeno passo para um homem, um salto gigantesco para a humanidade”.
O primeiro astronauta brasileiro é Marcos Cesar Pontes (1963-), que partiu
para a Estação Espacial Internacional (ISS) em 30 de março de 2006, a bordo
da nave russa Soyuz TMA-8, e retornou no dia 8 de abril, a bordo da nave
30 Engenharia de controle
Soyuz TMA-7.
Eletrônica
Os engenheiros que trabalham hoje em dia com Sistemas de Controle estão
familiarizados com notações tais como 1 mH, 5 Ω, 2 A, 5 V, 3 C, 10 µF, 100
Hz, 3 G, 7 Oe e 9 Wb, relacionados com alguns dos precursores de eletricidade
e magnetismo (Henry, Ohm, Ampère, Volta, Coulomb, Faraday, Hertz, Gauss,
Oersted e Weber, respectivamente).
Em 1799, Alessandro Giuseppe Antonio Anastasio Volta (1745-1827) demons-
tra a sua bateria (pilha de discos intercalados de zinco, cobre e água salgada).
Hoje em dia baterias empregando outros compostos são usadas em pilhas mais
compactas e eficientes.
Em 1845, Gustav Robert Kirchhoff (1824-1887) for-
mulou as conhecidas leis que levam o seu nome quando
ainda era estudante na Universidade de Königsberg.
Em 1906, Lee de Forest (26 de agosto de 1873-30 de
junho de 1961) concebe “Audion”, que é uma válvula
termoiônica tipo triodo. Com o advento da válvula
termoiônica a eletrônica tem uma rápida expansão em
termos de novos produtos, incluindo equipamentos de
áudio e de rádio.
No campo de receptores de rádio, em 1914, Edwin
Howard Armstrong (1890[2]-1954) solicitou uma pa-
tente sobre circuitos regenerativos (ou seja, com reali-
mentação negativa), concedida em 1906 (Wireless Re- Figura 2.8: Válvula
ceiving System, n. US 1113149A). Em 1931, Armstrong Termoiônica Audion,
obteve a patente do sistema receptor superheterodino, obtido de wikipe-
Radio Signaling System, n. US 1941066A. Em 1933, dia.org/wiki/Audion.
recebeu também a patente do FM de banda larga.
Telecomunicações
A era dos semicondutores inicia-se em 1947 com os trabalhos de William Brad-
ford Shockley (1910-1989), John Bardeen (1908-1991) e Walter Houser Brat-
tain (1902-1987), que desenvolveram o primeiro transistor efetivo nas depen-
dência dos laboratórios Bell. Julius Edgar Lilienfeld (1882-1963) depositou
uma solicitação de patente de um transistor de efeito de campo (FET) em
1925, no Canadá, mas um dispositivo operacional ainda não havia sido apre-
sentado.
Em 1971, a Intel introduziu o primeiro microprocessador comercial, 4004 de
Panorama histórico 31
4 bits, desenvolvido por Federico Faggin (1941-), Marcian Edward “Ted” Hoff
Jr. (1937-), Stanley Mazor (1941-) e Masatoshi Shima (1943-).
A transmissão, recepção, armazenamento, recuperação, processamento e pro-
teção de informações é muito relevante no projeto de controladores. Um exem-
plo óbvio é o controle remoto, mas, mesmo para um sistema simples de con-
trole, o sensor deve “comunicar” com o módulo de controle de modo a ter
pouca distorção, sofrer pouca interferência de ruı́dos, ter velocidade adequada
de transmissão etc.
Em 1876, Alexander Graham Bell (1847-1922) obteve a patente do telefone.
Porém, em 11 de junho de 2002, o Congresso dos Estados Unidos, através da
resolução N°. 269, reconheceu Antonio Santi Giuseppe Meucci (1808-1889)
como o verdadeiro inventor, uma vez que Meucci havia vendido o protótipo
a Bell por volta de 1870. Em 1875, registrou a patente de um telégrafo.
Em 1837, Sir William Fothergill Cooke (1806-1879) e
Charles Wheatstone (1802-1875) obtiveram uma pa-
tente conjunta, após uma acirrada disputa sobre a pri-
mazia da invenção do telégrafo de 5 agulhas. As agu-
lhas eram movidas eletromagneticamente. A letra se-
lecionada era a que ficava na intersecção da direção
apontada por 2 das agulhas (as demais agulhas perma-
neciam em uma posição neutra).
In 1835, Samuel Finley Breese Morse (1791-1872), con-
cebeu um método de representar letras e números atra-
vés de pontos e traços (código Morse: ·− = a, −· · · =
b, − · −· = c, etc). Utilizando esse método, Morse ob-
teve uma patente de telégrafo eletromagnético em 1873. Figura 2.9: Transis-
Em comunicações telefônicas a longas distâncias, existe tor. Obtido de com-
a necessidade de amplificação do sinal de voz, mas que puterhistory.com.
também amplifica o ruı́do. Para resolver esse problema
em amplificadores repetidores, Harold Stephen Black
(1898-1983) mostrou a efetividade da realimentação negativa em 1927. A rea-
limentação negativa é um conceito de fundamental importância na Teoria de
Controle.
Em 14 de agosto de 1894, Oliver Joseph Lodge (1851-1940) transmitiu sinais
de rádio em um encontro da Associação Britânica para o Avanço da Ciência
na Universidade de Oxford e obteve a patente US 609.154 de 1898, Electric
Telegraphy.
Em 1896, Guglielmo Giovanni Maria Marconi, Marquis of Marconi (1874-1937)
requereu a patente britânica No. 12,039, concedida em 1897, Improvements
in Transmitting Electrical Impulses and Signals, and in Apparatus therefor.
32 Engenharia de controle
Computador digital
Wallauschek.
No dia 29 de outubro de 1969, ARPAnet enviou a primeira mensagem de um
computador na UCLA para um outro em Stanford. A tecnologia de rede de
computadores evoluiu rapidamente e, em 1970, Robert Elliot Kahn (1938-) e
Vinton Gray Cerf (1943-) propuseram o Transmission Control Protocol and
Internet Protocol, or TCP/IP. Em 1 de janeiro de 1983, a ARPANET adotou
a TCP/IP e a rede de redes evoluiu para a Internet.
A terceira revolução industrial, de meados do século XX a inı́cio do século
XXI, é um efeito conjunto de vários fatores, incluindo a disseminação de equi-
pamentos eletrônicos, avanços na tecnologia de semicondutores, a energia nu-
clear, a disseminação do computador digital e efeitos decorrentes disso, como
a robótica, Internet, além da descoberta de novos fenômenos fı́sicos, como a
supercondutividade e light amplification by stimulated emission of radiation
(LASER), que impulsionaram o desenvolvimento de novos processos e produ-
tos. Trata-se de uma época muito criativa, com inovações na indústria far-
macêutica, imagiologia médica, explorações espaciais, mecanização agrı́cola,
automação bancária, controle de tráfego e de cargas, armamentos inteligentes
etc.
Indústria 4.0
A indústria 4.0 é a quarta revolução industrial, resultado da amalgamação de
várias tecnologias avançadas, tais como a inteligência artificial, aprendizado
de máquina, a computação em nuvem, big data, internet das coisas, robótica
autônoma, realidade virtual, realidade aumentada, manufatura aditiva, proto-
tipação rápida, energia limpa, sustentabilidade etc.
2.1 IFAC
O primeiro evento na área de Controle Automático foi realizado na Univer-
sidade de Heidelberg entre os dias 25 e 29 de setembro de 1956 sob o tı́tulo
Regelungstechnik – Moderne Theorien und ihre Verwendbarkeit. Neste evento
os participantes assinaram um acordo para a criação de uma organização in-
ternacional e foi estruturado um Comitê Provisório sob a presidência de Victor
Broida, responsável por fundar a International Federation of Automatic Con-
trol (IFAC).
Em 12 de setembro de 1957 foi realizada a Primeira Assembleia Geral, em
Paris, no Conservatoire National des Arts et Métiers, com a participação de
delegados de 18 paı́ses. A Primeira Assembleia Geral convocou a reunião
constituinte em Paris. Nessa assembleia foram votados os Estatutos e eleito o
34 Engenharia de controle
2.5 Exercı́cios
2.5.1 Exercı́cio
Este capı́tulo apresentou alguns dos marcos relevantes no desenvolvimento de
sistemas de controle. Comente sobre os possı́veis impactos de sistemas de
controle nos seguintes campos
2. Sustentabilidade
4. Comunicação digital
5. Qualidade da vida
6. Exploração espacial
7. Robótica
8. Veı́culos autônomos
2.5.2 Exercı́cio
Liste 5 novas tecnologias que tem recebido atenção nos últimos anos e comente
sobre o potencial impacto na sociedade do futuro, incluindo considerações
sobre a Teoria de Controle Automático.
Parte II
39
3
Modelos dinâmicos
41
42 Engenharia de controle
∂ 4 y(t, x) ∂ 2 y(t, x)
EI = −ρA (3.3)
∂x4 ∂t2
em que E é o módulo de elasticidade, I o momento de inércia, ρ a
densidade do material da viga e A a área da secção transversal. Os
modos de vibração, nesse caso, podem ser vistos na figura 3.2.
dn y dy
F( n
, ..., , y, u, t) = 0, (3.6)
dt dt
em que y é a saı́da, u é a entrada, t é o tempo e F alguma função que busca
descrever o comportamento do sistema. (OBS: Para simplificar a notação, y e
u são assumidas pertencerem a R) nesta Seção.
O sistema é dito ser linear se a função F assume a forma particular
dn y dn−1 y dy
n
+ a 1 (t) n−1
+ ... + an−1 (t) + an (t)y − b0 (t)u(t) = 0 (3.7)
dt dt dt
dy d2 y dn−1 y dn y
ẏ = ; ÿ = ; ··· ; y (n−1) = ; y (n) = (3.9)
dt dt2 dtn−1 dtn
de modo que a expressão 3.8 pode ser reescrita mais compactamente
No caso de enfoque caixa branca, admite-se que são conhecidas as leis fı́sicas
que regem o comportamento do sistema que se encontra no seu interior (por
exemplo, Leis de Kirchhoff, Lei de Newton, princı́pio da mı́nima ação, equação
de continuidade, conservação da energia etc.)
No caso de enfoque caixa preta, busca-se obter o modelo a partir dos registros
dos sinais de entrada e da saı́da do sistema (caixa) (por exemplo, uma sequên-
cia de pares entrada-saı́da {u[k], y[k]}k=1,2,... obtidas com a utilização de um
equipamento digital para aquisição de dados).
O procedimento para obter modelos utilizando o enfoque caixa preta é cha-
mado, usualmente, de identificação. Na prática é comum o emprego de méto-
1. The simplest control system that will do the job is the best.
2. You must understand the process before you can control it.
i1 − i2 − i3 = 0 (3.11)
1
−u + Ri1 + Ri3 + y = 0 (3.12)
2
−v2 + v1 + y = 0 (3.13)
1
−v2 + Ri3 + y = 0 (3.14)
2
Modelos dinâmicos 47
i2 = C v̇1 (3.15)
ẏ
i3 = C (3.16)
2
e, portanto, combinando as equações 3.12 e 3.11, obtém-se
1
Ri1 + Ri3 + y = u (3.17)
2
1
R (i2 + i3 ) + Ri3 + y = u (3.18)
2
1
RC v̇1 + RC ẏ + y = u (3.19)
2
Combinando-se as equações 3.11 a 3.19, pode-se escrever
!
ÿ C 1
R CRC − ẏ + RC ẏ + y = u (3.20)
2 2 2
e a equação diferencial que descreve o circuito da figura 3.4 pode ser colocada
na forma padrão
R2 C 2 ÿ + RC ẏ + y = 2u (3.21)
Esse circuito é um filtro de segunda ordem muito utilizado na prática e cujo
comportamento poderá ser mais bem estudado após o capı́tulo sobre resposta
em frequência.
Um fato importante na obtenção desse modelo é que não foi considerada a
possı́vel saturação do OpAmp. Por exemplo, se a alimentação do OpAmp for
de ±15 V , não é conveniente que a saı́da y se aproxime desses valores.
x ⇝ q (3.27)
c ⇝ L (3.28)
J(x) ⇝ A(q) (3.29)
Um tratamento mais rigoroso desse problema pode ser encontrado, por exem-
plo, em (BLISS, 1980), (GOLDSTEIN, 1980), (YOUNG, 1969), entre outros.
L = T −U (3.32)
1 1
= m1 q̇ 2 + m2 q̇ 2 +
2 2
+m1 gq + m2 g (L − q) (3.33)
e, portanto, fazendo-se !
d ∂L ∂L
− =0 (3.34)
dt ∂ q̇ ∂q
em que
∂L
= m1 g − m2 g (3.35)
∂q
∂L
= m1 q̇ − m2 q̇ (3.36)
∂ q̇
!
d ∂L
= m1 q̈ + m2 q̈ (3.37)
dt ∂ q̇
50 Engenharia de controle
(m1 + m2 ) q̈ − m1 g + m2 g = 0 (3.38)
m1 − m2
q̈ = g (3.39)
m1 + m2
Seja um pêndulo simples com haste rı́gida, conforme ilustrado na figura 3.6.
x = L sin(θ) (3.40)
y = −L cos(θ) (3.41)
1 1
T = m(ẋ2 + ẏ 2 ) = mL2 θ̇2 (3.42)
2 2
U = −mgL cos(θ) (3.43)
1
L = mL2 θ̇2 + mgL cos(θ) (3.44)
2
Modelos dinâmicos 51
∂L
= −mgL sin(θ) (3.45)
∂θ
∂L
= mL2 θ̇ (3.46)
∂ θ̇
!
d ∂L
= mL2 θ̈ (3.47)
dt ∂ θ̇
∂L
= mg cos(θ) − ke + m(L + e)θ̇2 (3.53)
∂e
∂L
= −mg(L + e) sin(θ) (3.54)
∂θ
∂L
= mė (3.55)
∂ ė
∂L
= m(L + e)2 θ̇ (3.56)
∂ θ̇
!
d ∂L
= më (3.57)
dt ∂ ė
!
d ∂L
= m(L + e)ėθ̇ + m(L + e)2 θ̈ (3.58)
dt ∂ θ̇
x1 = L1 sin(θ1 ) (3.61)
x2 = L1 sin(θ1 ) + L2 sin(θ2 ) (3.62)
y1 = −L1 cos(θ1 ) (3.63)
y2 = −L1 cos(θ1 ) − L2 cos(θ2 ) (3.64)
1 1
T = m1 (x˙1 2 + y˙1 2 ) + m2 (x˙2 2 + y˙2 2 ) (3.65)
2 2
1 2 ˙ 21
= 2 2
m1 L1 θ1 m2 [L1 θ̇1 + L22 θ̇22 (3.66)
2 2
+2L1 L2 θ1 θ˙2 cos(θ1 − θ2 )]
˙ (3.67)
U = m1 gy1 + m2 gy2 (3.68)
= −(m1 + m2 )gL1 cos(θ1 ) (3.69)
−m2 gL2 cos(θ2 ) (3.70)
Calculando-se os termos
! !
∂L ∂L ∂L ∂L d ∂L d ∂L
; ; ; ; ; (3.71)
∂θ1 ∂θ2 ∂ θ̇‘1 ∂ θ̇2 dt ∂ θ˙1 dt ∂ θ˙2
1 2
T = mq̇ (3.75)
2
1 2
U = kq (3.76)
2
54 Engenharia de controle
Analogia eletromecânica
1. Analogia força-tensão: Se a grandeza f for associada a v (com correção
1
C ) as soluções das EDO’s 1 e 3 serão as mesmas se, numericamente,
L = m, R = b e C1 = k.
Exemplo
Se a grandeza f for associada a i (com correção L1 ) as soluções das EDO’s 1 e
2 serão as mesmas se, numericamente, C = m, R1 = b e L1 = k e, além disso,
T = Ri (3.95)
dT
i = C (3.96)
dt
e a sistemas hidráulicos (resistência R, capacidade volumétrica C, variável
entre = p, pressão, variável através = q, vazão, como já visto anteriormente
no exemplo de tanques.
Figura 3.13: Devido ao tempo para o plugue de água corada percorrer a tubu-
lação, a leitura do segundo sensor (em verde) é atrasada em relação ao primeiro
(em vermelho).
pelo gráfico da figura 3.13 que o pico do sinal y(t) ocorre com atraso de θ
unidades de tempo, em relação ao sinal u(t). Nesse exemplo, a forma de onda
de y(t) é mais “alargada” do que u(t) em vista de a tinta ter se difundido para
a vizinhança do plugue.
Caso a forma de onda de y(t − θ) seja a mesma que de u(t), ter-se-á o caso de
atraso puro, ou seja,
y(t) = u(t − θ) (3.97)
Modelos dinâmicos 59
x1 = y (3.99)
x2 = ẏ (3.100)
···
xn = y (n−1) (3.101)
dy d2 y
em que ẏ = dt , ÿ = dt2
e, a partir de n = 3, é usual utilizar a notação
n
y (n) = ddtny .
Nessas condições, tomando-se derivadas em t nas equações 3.99, obtém-se o
sistema de equações diferenciais
ẋ1 = ẏ = x2 (3.102)
ẋ2 = ÿ = x3 (3.103)
···
ẋ1 = y (n) = −a1 y (n−1) − ... − an−1 ẏ − an y + u (3.104)
= −a1 xn − ... − an−1 x2 − an x1 + u (3.105)
padas na forma
0 1 0 ··· 0 0
···
0 0 1 0 0
.. .. .. .. ..
ẋ =
.. x +
u
(3.106)
. . . . . .
0 0 0 ··· 1
0
−an −an−1 −an−2 · · · −a1 1
| {z } | {z }
A B
De 3.102 a 3.105 , depreende-se também que
h i
y= 1 0 ··· 0 0 x (3.107)
| {z }
C
Será visto mais adiante que a representação no espaço de estados ẋ = Ax+Bu
não é única (por exemplo, uma representação diferente pode ser obtida fazendo
se uma transformação similar z = Px em que P é não singular).
A solução do sistema de equações diferenciais ordinárias 3.106 pode ser deter-
minada, por exemplo, pelo método construtivo utilizando a iteração de Picard
apresentado no Apêndice B.
Aqui, será apenas verificado através de substituição que a expressão
Z t
x (t) = eAt x (0) + eA(t−τ ) Bu(τ )dτ (3.108)
0
satisfaz
ẋ = Ax + Bu (3.109)
com a condição inicial x(0).
De fato, notando que a variável de integração é τ e não t, a equação 3.108 é
reescrita como
Z t
x (t) = eAt x (0) + eAt e−Aτ Bu(τ )dτ (3.110)
0
Z t !
At −Aτ
= e x (0) + e Bu(τ )dτ (3.111)
0
∆ 1 2 2 1
eAt = I + At + A t + A3 t3 + · · · (3.114)
2! 3!
∆(A) = 0 (3.118)
*0
P (A) = Q(A)
∆(A)
+ R(A) (3.120)
= R(A) (3.121)
τ = K2 ia (3.131)
obtém-se
dω
= K2 ia J (3.132)
dt
Por outro lado, a lei de Kirchoff aplicada à parte elétrica leva a
dia
va − ea = Ria + L (3.133)
dt
em que a força contraeletromotriz induzida é
ea = K1 ω (3.134)
Em não havendo perdas no motor, a potência elétrica deve ser igual à potência
mecânica,
p = ea ia = τ ω (3.135)
K1 ωia = K2 ia ω (3.136)
K1 = K2 = K (3.137)
= λ2 + 3λ + 2 (3.145)
que são λ = −1 e −2.
Pela metodologia proposta, a expressão para eAt é
0 1 " # " #
t
−2 −3 1 0 0 1
e = α0 (t) + α1 (t) (3.146)
0 1 −2 −3
ẋ = εf (x, t) (3.161)
Exemplo
Seja um sistema descrito por
ẋ = ε −0.5x2 + x sin2 (t) (3.165)
Modelos dinâmicos 69
em que x(t) ∈ R para cada t fixo. Neste caso, como f (x, t) é de perı́odo π,
Z π
1
−0.5x2 + x sin2 (τ ) dτ
f (x) = (3.166)
π 0
= 0.5 x − x2 (3.167)
Pêndulo de Kapitsa
1−D
G(s) = (3.181)
(1−D)2
1 R
LC s2 + R0 C + L s+ LC
72 Engenharia de controle
3.7 Linearização
Quando o modelo do sistema fı́sico é linear, são disponı́veis vários métodos
efetivos para o projeto do controlador.
Um enfoque para projetar de controladores é, portanto, obter inicialmente um
modelo linearizado para o sistema fı́sico.
Embora existam vários métodos para obter uma aproximação linear para um
modelo não linear, apresenta-se neste capı́tulo apenas o método do trunca-
mento da série de Taylor. Posteriormente serão mostrados outros métodos.
Modelos dinâmicos 73
˙ ≃ ∇T f (xE , uE ) ∆x + ∇T f (xE , uE ) ∆u
∆x (3.187)
x u
˙ ≃ A(xE , uE ) ∆x + B(xE , uE ) ∆u
∆x (3.188)
74 Engenharia de controle
Estabilidade estrutural
ẋ = x2 − 2x + 1 + µ (3.190)
x2 − 2x + 1 = 0 ou (3.191)
√
2± 4−4×1
x = (3.192)
2
= 1 (3.193)
x2 − 2x + 1 = 0 ou (3.194)
p
2 ± 4 − 4 × (1 + 10−10 )
x = (3.195)
2
= 1 ± j10− 5 [complexos) (3.196)
˙ = ∇T f (x, u) ∆x + ∇T f (x, u) ∆u
∆x (3.197)
x u
= 0 ∆x + 3 u2 ∆u (3.198)
u=0
= 0 (3.199)
ẋ = Fx (3.203)
ż = Gz (3.204)
F = H−1 GH (3.205)
ẋ = f (x) (3.206)
˙ = A(xE ) ∆x
∆x (3.207)
Teorema de Hartman-Grobman
O teorema de Hartman–Grobman (1959/1960), também conhecido como o te-
orema da linearização, permite caracterizar o comportamento local de sistemas
dinâmicos na vizinhança de pontos de equilı́brio hiperbólicos.
Seja x(t) ∈ Rn a solução de ẋ = f (x) para um mapa suave (smooth) f :
Rn → Rn e xE um ponto de equilı́brio hiperbólico. Então existem vizinhanças
X(xE ) ⊂ Rn e Z(0) ⊂ Rn e um homeomorfismo h : X → Z tais que
1. h(xE ) = 0,
˙ = A∆x.
2. h ◦ f = A ◦ h em que ẋ = f (x) e ∆x
˙ = A∆x) são topologi-
Logo o modelo original (ẋ = f (x)) e o linearizado (∆x
camente conjugados.
Um resultado imediato é que se todos os autovalores da matriz Jacobiana
A(xE ) = ∇Tx f (xE ) possuem a parte real negativa, esse ponto de equilı́brio
hiperbólico xE é estável.
Esse procedimento para verificação da estabilidade é conhecido como o “pri-
meiro método de Lyapunov” (ou o “método indireto de Lyapunov”).
Em problemas de controle existem, em geral, variáveis manipuladas (aqui de-
notadas u e v).
Considere 2 modelos descritos por
Contraexemplo
Considere o sistema escalar
ẋ = f (x, u) (3.214)
3
= u (3.215)
˙ = ∇T f (xE , uE ) ∆x + ∇T f (xE , uE ) ∆u
∆x (3.216)
x u
= 0 ∆x + 3 u2E ∆u (3.217)
uE =0
= 0 (3.218)
ẋ = Ax + Bu (3.220)
y = Cx (3.221)
Sistemas LTI SISO são ditos globalmente assintoticamente estáveis (com certo
abuso de linguagem, pois estabilidade é propriedade de pontos de equilı́brio) se
todos os autovalores da matriz de sistemas An×n (ou, equivalentemente, todas
as raı́zes λk do polinômio caracterı́stico ∆(λ)) possuem parte real negativa,
pois
n
X
x(t) = Mk eλk t (3.225)
k=1
y = Cx(t) (3.226)
se u(t) = 0.
No domı́nio transformado, tal fato se traduz na condição de que todos os
polos da função de transferência estão localizados estritamente no semiplano
esquerdo.
Existem vários critérios que permitem verificar se todos os polos da função
de transferência estão localizados estritamente no semiplano esquerdo, sem a
necessidade de calculá-los. Alguns desses critérios serão apresentados em um
capı́tulo próprio adiante.
80 Engenharia de controle
3.9 Controlabilidade
Considere um sistema LTI de dimensão n descrito por
ẋ = Ax + Bu (3.227)
xf = x(tf ) (3.228)
ou seja, existe uma lei de controle u(t) que leva um estado x0 a um outro xf ,
ambos arbitrários.
Levando-se em conta a expressão da solução da equação diferencial 3.227, a
fórmula que expressa a transferência de x(0) = x0 para x(tf ) = xf é
Z tf
xf = e Atf
x0 + eA(tf −τ ) Bu(τ ) dτ
0
Z tf !
Atf −Aτ
= e x0 − e Bu(τ ) dτ (3.229)
0
∆x = e−Atf xf − x0 (3.230)
Z tf
= e−Aτ Bu(τ ) dτ (3.231)
0
A tarefa é obter u(t) de modo que a equação 3.231 seja satisfeita. Ressalta-
se que a solução não é única, pois pode-se transitar de x0 a xf percorrendo
caminhos diferentes e que correspondem a u(t) distintos.
Propõe-se a seguinte lei de controle
T
u(t) = BT e−A t WC (0, tf )−1 ∆x (3.232)
torna
Z tf Z tf
Tτ
e−Aτ Bu(τ )dτ = e−Aτ BBT e−A WC (0, tf )−1 ∆x dτ(3.234)
0 0
Z tf
Tτ
= e−Aτ BBT e−A dτ WC (0, tf )−1 ∆x(3.235)
0
| {z }
WC (0,tf )
= ∆x (3.236)
que é o resultado desejado, notando que WC (0, tf )−1 e−Atf xf − x0 foi posto
para fora da integral por este não depender de τ .
Portanto, caso WC (t1 , t2 ) definido em 3.233 seja uma matriz invertı́vel para
t1 ̸= t2 , é possı́vel transitar de x0 a xf e, consequentemente, o sistema é
controlável. Resta verificar se há uma forma simples de verificar se WC (t1 , t2 )
é invertı́vel.
Ao invés de uma prova formal, será mostrado que um critério simples para
verificar a controlabilidade é testar se
h i
n−1
ρ B : AB : ... : A B =n (3.237)
em que
Φ = a0 (τ )B + a1 (τ )AB + ... + an−1 (τ )An−1 B (3.241)
Logo, a não singularidade de WC (t1 , t2 ) está relacionada
h com a não-singularidade
i
de Φ que, por sua vez, depende do posto de U = B : AB : ... : An−1 B .
Detalhes de uma prova completa podem ser encontrados em (CHEN, 1970),
(HESPANHA, 2009) e (KAILATH, 1980), entre outros.
82 Engenharia de controle
O caso de WC (0, ∞)
Para o cálculo de WC quando o processo é estável e invariante no tempo, note,
inicialmente, que
d At
e = AeAt (3.242)
dt
que permite escrever
d At T
T T
e BBT eA t = AeAt BBT eA t + eAt BBT eA t AT (3.243)
dt
Integrando esta expressão, e lembrando da hipótese de que A é estável
−BBT WC WC
z }| { zZ }| {
∞ ∞
z }| ∞{ Z
At T AT t At T AT t At T AT t
e BB e =A e BB e dt + e BB e dt AT (3.244)
0 0 0
constata-se que
AWC + WC AT + BBT = 0 (3.245)
que resulta na mesma função de transferência que 3.250, mas agora empre-
gando {A, B, C} em 3.253 e 3.254
−1
s 0 6 3
Y (s) h i
= 0 0 1 −1 s 11 1 (3.255)
U (s)
0 −1 s + 6 0
s+3 1
= = 2 (3.256)
(s + 1)(s + 2)(s + 3) s + 3s + 2
3.10 Observabilidade
Por outro lado, seja um sistema LTI de dimensão n descrito por
ẋ = Ax + Bu, (3.258)
y = Cx, (3.259)
84 Engenharia de controle
ou seja,
Z t
CeAt x0 = y(t) − CeA(t−τ ) Bu(τ )dτ (3.261)
0
| {z }
γ(t)
ρ (V) = n (3.267)
Modelos dinâmicos 85
em que
C
CA
V= (3.268)
..
.
CAn−1
para o qual
" #
C
V = (3.273)
CA
" #
1 0
= (3.274)
0 1
ẋ = Ax + Bu (3.275)
y = Cx + Du (3.276)
ẋ = Ax + Bu (3.278)
y = Cx + Du (3.279)
A
b B
b
z }| { z }| {
−1
ż = T AT z + T−1 B u (3.281)
C
b
z}|{
y = CT z + Du (3.282)
A
bWc +W
cAbT +B
bBbT = 0 (3.283)
−1 T T −T −1 T −T
T c + WT
ATW c A T +T BB T = 0 (3.284)
W W
z }| { z }| {
c T + TWT
A TWT c T AT + BBT = 0 (3.285)
e, portanto,
b = TT VT
V (3.290)
O objetivo é buscar T de modo que
b =W
V c =Λ (3.291)
em que Λ é diagonal
σ1
Λ=
..
(3.292)
.
σn
Uma forma de obter T é através da decomposição em valores singulares (SVD
- Singular Value Decomposition).
1 1
Sejam as matrizes raiz quadrada W 2 e V 2 de W e V, respectivamente, que
88 Engenharia de controle
pode ser obtida via decomposição de Cholesky (vide, por exemplo, (BERNS-
TEIN, 2009)).
1 T
W = W2 W 2 (3.293)
1 T
V = V V 2 2 (3.294)
T 1
Através da Decomposição em Valores Singulares (SVD) da matriz V 2 W 2 ,
obtém-se N e M
T 1
V 2 W 2 = MΛNT (3.295)
em que MT M = I e NT N = I (ou seja, M−1 = MT e N−1 = NT ).
T 1
Observando em 3.295 que Λ = MT V 2 W 2 N a transformaçâo buscada é
1 1 T 1
T = W 2 NΛ− 2 = V− 2 MΛ 2
−1 −1
De fato, notando que (XY)−T = (YT XT )−1 = XT YT
c = T−1 WT−T
W (3.296)
T
− 21 1
− 12
= Λ MT V WV MΛ
2 2 (3.297)
MΛNT NΛMT
z }| {z }| {
T T
− 21 1 1 1
= Λ M V 2 W 2 W 2 V 2 MΛ− 2
T
(3.298)
− 21 T T T − 12
= Λ M MΛN NΛM MΛ =Λ (3.299)
Analogamente para V,
b
Vb = TT VT (3.300)
T
− 21 1
− 12
= Λ NT W VW NΛ
2 2 (3.301)
NΛMT MΛNT
z }| {z }| {
T T
− 21 1 1 1
= Λ N W 2 V 2 V 2 W 2 NΛ− 2
T
(3.302)
− 21 T T T − 12
= Λ N NΛM MΛN NΛ =Λ (3.303)
Os passos para balancear um modelo no espaço de estados são
x˙1 = x2 (3.305)
x˙2 = µ(1 − x21 )x2 − x1 + v (3.306)
Como pode ser visto na figura 3.21, para o caso particular da equação de Van
der Pol controlada, basta que se alimente cada bloco integrador com sinais ẋ
apropriados.
possui a propriedade
df
L[ (t)] = sF (s) − f (0) (3.309)
dt
Aplicando-se a transformada de Laplace aos dois lados da equação de estados
ẋ = Ax + Bu (3.310)
obtém-se que
A expressão
Y(s)
G(s) = = C(sI − A)−1 B + D (3.316)
U(s)
é denominada de função de transferência do sistema e representa, no domı́nio
transformado “s”, uma relação entre as grandezas de entrada e a saı́da.
A função de transferência é dita ser uma representação externa de um sistema
(ou seja, envolve apenas u e y), enquanto as equações de estado são ditas
Modelos dinâmicos 91
N (s)
G(s) = (3.318)
D(s)
K (sm + b1 sm−1 + · · · + bm)
= (3.319)
sn + b1 sn−1 + · · · + bn
K (s − ζ1 ) · · · (s − ζm )
= (3.320)
(s − π1 ) · · · (s − πn )
2. L−1 u(t) = 1
s (degrau unitário)
h i
3. L−1 e−at = 1
s+a
h i
4. L−1 te−at = 1
(s+a)2
5. L−1 cos(ωt) = s
s2 +ω 2
6. L−1 sin(ωt) = ω
s2 +ω 2
92 Engenharia de controle
2s + 1
G(s) = (3.322)
s2 + 5s + 6
2s + 1 1 r1 r2 r3
L 2
= L + + (3.326)
s + 5s + 6 s s+2 s+3 s
2s + 1 1 r1 r2 r3
= + + (3.327)
s2 + 5s + 6 s s+2 s+3 s
2s + 1 1
(s
+ = r1 (s + 3) + r2 (s
3) + r3 (s + 3) (3.328)
+
3)
+ 3) s
(s + 2)
(s
s+2 s+3
s
5 r1 :0
r3 :0
− = (s
+ 3) + r2 + (s
+ 3) (3.329)
3 s+2
s
como
2s + 1 1
y(t) = L 2 (3.330)
s + 5s + 6 s
"
− 35 3 1
#
= L + 2 + 6 (3.331)
s+2 s+3 s
"
− 35
# " #
1
1.5
= L +L +L 6 (3.332)
s+2 s+3 s
5 3 1
= − e−2t + e−3t + 1(t) (3.333)
3 2 6
Da expressão 3.315,
em que
" #−1
−1
h i s −1
C (sI − A) = 1 0 (3.336)
2 s+3
h i
s+3 1
= s2 +3s+2 s2 +3s+2 (3.337)
e
" #−1
−1
h i s −1
C (sI − A) B = 1 0 (3.338)
2 s+3
" #
h
s+3 1
i 0
= s2 +3s+2 s2 +3s+2 (3.339)
1
1
= (3.340)
s2 + 3s + 2
Portanto, para o motor DC, a relação entrada-saı́da é dada por
h
s+3 1
i 1
Y (s) = s2 +3s+2 s2 +3s+2 x (0) + U (s) (3.341)
s2 + 3s + 2
94 Engenharia de controle
s2 + 3s + 1 r1 r2 r3
= + + (3.351)
s(s + 1)(s + 2) s s+1 s+2
(r1 + r2 + r3 ) s2 + (3r1 + 2r2 + r3 ) s + 2r1
= (3.352)
s(s + 1)(s + 2)
Igualando-se os numeradores em 3.351-3.352,
r1 + r2 + r3 = 1 (3.353)
3r1 + 2r2 + r3 = 3 (3.354)
2r1 = 1 (3.355)
Modelos dinâmicos 95
s = −σ ± jωd (3.387)
σ = ξωn (3.388)
q
ωd = ωn 1 − ξ 2 (3.389)
Observação importante
Notar que o sobressinal Mp depende somente do coeficiente de amortecimento
ξ, enquanto o tempo de subida tr depende de ξ e de ωn .
Embora ainda não tenha sido definido formalmente, a margem de fase de um
sistema de segunda ordem é calculada a partir da malha aberta
ωn2
L(s) = (3.394)
s2 + 2ξωn
e a sua fórmula é
2ξ
γ = tan−1 qp (3.395)
1 + 4ξ 4 − 2ξ 2
também depende apenas de ξ.
·
Assumindo que o corpo está inicialmente em repouso (y = 0, y = 0) e a força
f é aplicada a partir de t = 0, a transformada de Laplace permite escrever
ms2 + bs + k Y (s) = F (s) (3.397)
ou
1
Y (s) m
= 2 b k
(3.398)
F (s) s + ms + m
Logo os parâmetros ξ e ωn são
s
k
ωn = (3.399)
m
b
2ξωn = (3.400)
m
Os modelos de segunda ordem são, muitas vezes, úteis para o estudo de siste-
mas de ordem maior, pois muitas vezes estes podem ser aproximados, valendo-
se do conceito de polos dominantes.
Seja um sistema que possui polos p1 = −σ + jω, p2 = −σ − jω (σ > 0, ω ≥ 0)
além de polos pi , i = 3, ..., n de modo que Re {pi } ≪ −σ, i = 3, ..., n. Lem-
brando que eRe{pi }t decai muito mais rapidamente que e−σt , constata-se qu,e
após um breve transitório, os modos que predominam são ep1 t e ep2 t .
Considere a função de transferência
106
G(s) = (3.401)
(s + 1)(s + 2)(s + 100)(s + 200)
106
= ← ERRADO! (3.410)
(s + 1)(s + 2)
6 = 4ξω − 2p (3.418)
2
5 = 2ω − 4pξω (3.419)
2
a = −2pω (3.420)
3 incógnitas
3 = ω−p (3.421)
2
5 = 2ω − 2pω (3.422)
2
a = −2pω (3.423)
1 −s + α
G1 (s) = (3.424)
α s2 + s + 1
1 s+β
G2 (s) = (3.425)
β s2 + s + 1
N (s) U ω
= (3.430)
(s + p1 ) ... (s + pn ) (s − jω) (s + jω)
cuja expansão em frações parciais, assumindo que o conjunto de polos é cons-
tituı́do de polos reais distintos, polos reais com multiplicidade maior que 1 e
polos complexos conjugados, resulta em
A1 An Bk1 Bk2
Y (s) = + ··· + + + +
(s + p1 ) (s + pn ) (s + pk ) (s + pk )2
C1 s + D 1 E E∗
+··· + + · · · + + (3.431)
(s + σ1 )2 + ω12 (s − jω) (s + jω)
Como por hipótese todos os polos do sistema têm parte real negativa, a saı́da
em regime permanente (t → ∞) será
e note que
G(jω) = K |jω − z1 | ... |jω − zm |
(3.439)
|jω − p1 | ... |jω − pn |
Para fazer esboços gráficos, é mais conveniente que se tenha somas de termos
ao invés de multiplicações. Assim, aplicando-se 20 log(.) em ambos os lados
da expressão 3.439 tem-se que
20 log G(jω) = 20 log K + 20 log |jω − z1 | + ... + 20 log |jω − zm |
−20 log |jω − p1 | + ... + 20 log |jω − pn | (3.440)
• Se ω >> a, então 20 log |jω − a| ≃ 20 log ω que é uma reta usando escala
[dB] na ordenada e log ω.
numéricos do módulo |GM A (jω)| e da fase ∡GM A (jω) para uma dada frequên-
cia ω, a Carta de Nichols permite ler graficamente o módulo |GM F (jω)| e a
fase de ∡GM F (jω) de malha fechada
GM A
GM F = (3.448)
1 + GM A
ação das altas frequências em relação às baixas pode ser expresso quantitati-
vamente pela largura de banda.
Dada uma função de transferência G (s), a largura de banda é a faixa (0, ωc ),
sendo que a frequência de corte ωc é caracterizada por
G (jω) < G (jωc ) − 3 dB ∀ω > ωc . (3.450)
Y (s)
= G(s) (3.452)
U (s)
c0
= (3.453)
sn + a1 sn−1 + ... + an−1 s + an
e, note que, para condições iniciais nulas e utilizand0 a notação y (α) = dα y/dtα ,
tem-se
y (n) + a1 y (n−1) + ... + an−1 ẏ + a0 y = c0 u (3.454)
ou
y (n) = −a1 y (n−1) − ... − an−1 ẏ − a0 y + c0 u (3.455)
114 Engenharia de controle
Fazendo-se a associação
x1 = y (3.456)
x2 = ẏ (3.457)
..
.
xn−1 = y (n−2) (3.458)
(n−1)
xn = y (3.459)
ẋ1 = ẏ = x2 (3.460)
ẋ2 = ÿ = x3 (3.461)
..
.
ẋn−1 = y (n−1) = xn−2 (3.462)
(n)
ẋn = y = −a1 xn − ... − an−1 x2 − an x1 + c0 u (3.463)
tem-se
0 1 0 ··· 0 0
···
0 0 1 0 0
.. .. .. .. ..
ẋ =
.. x +
u
(3.465)
. . . . . .
0 0 0 ··· 1
0
−an −an−1 −an−2 · · · −a1 1
| {z } | {z }
A B
e h i
y= c0 0 0 0 0 x (3.466)
| {z }
C
ou seja,
ẋ = Ax + Bu (3.467)
y = Cx (3.468)
Y (s) r1 rn
= + ... + (3.480)
U (s) s − p1 s − pn
ou seja,
A realização de
ri
Gi (s) = ; i = 1, ...n (3.483)
s − pi
é imediata,
ẋi = −pxi + ri u ; i = 1, ...n (3.484)
h iT
Assim, para x = x1 x2 · · · xn−1 xn pode-se escrever
−p1 0 0 ··· 0 r1
−p2 ···
0 0 0 r2
.. .. ..
ẋ =
.. x +
u
(3.485)
. . . ··· 0 .
0 0 0 −pn−1 0
r
n−1
0 0 0 ··· −pn rn
| {z } | {z }
A B
e = Px
x (3.487)
permite escrever
ė = Pẋ
x (3.488)
= P (Ax + Bu) (3.489)
−1
= PAP PBu
e + |{z}
| {z } x (3.490)
A
e B
e
det(λI − A)
e = det(λPP−1 − PAP−1 ) (3.491)
= det(P(λI − A)P) (3.492)
XXX−1
= X det(λI − A) det(P
det(P) ) (3.493)
X XX XX
= det(λI − A) (3.494)
β0 sn + β1 sn−1 + · · · + βn
G(s) = (3.495)
sn + α1 sn−1 + · · · + αn
Através de divisão longa, G(s) pode ser escrita em termos de polinômio em si ,
β0 sn + β1 sn−1 + · · · + βn
= β0 + (β1 − α1 β0 )s−1 + · · · (3.496)
sn + α1 sn−1 + · · · + αn h0 h1
−1
= h0 + h1 s + h2 s−2 + · · · (3.497)
h0 = β 0 (3.498)
h1 = −α1 h0 + β1 (3.499)
h2 = −α1 h1 − α2 h0 + β2 (3.500)
..
.
hk = −α1 hk−1 − α2 hk−2 − · · · − αk h0 + βk (3.501)
118 Engenharia de controle
Portanto, a função de transferência pode ser escrita como uma soma de po-
tências de s com os coeficientes dados pelos parâmetros de Markov:
ẋ = Ax + Bu y = Cx
Sabendo-se que
hk = CAk−1 B
n∗ = ρ H(n + 1, n)
(3.509)
• Obter α1 α2 · · · αn∗ ∗
1 ∗
0 ··· 0 tal que
n +1 n +2 n+1
h i
α1 α2 · · · αn∗ 1 0 ··· 0 H(n + 1, n) = 0 (3.510)
• Construir as matrizes A, B e C
0 1
.. ..
h1
. .
.
A = ; B = .. (3.511)
0 1
hn∗
−α1 −α2 · · · −αn∗
h i
C = 1 0 ··· 0 (3.512)
possuem rank n∗ .
Portanto, a representação é completamente controlável e observável, ou seja,
a realização é mı́nima.
120 Engenharia de controle
Teorema de Silverman
Uma sequência infinita de parâmetros de Markov é realizável por um modelo
LTI, se e somente se existirem inteiros n e m tal que ρ(H(n, m)) = ρ(H(n +
1, m + i)) = n∗ para i = 1, 2, .... Nesse caso, n∗ é a ordem da realização
mı́nima.
e
∆ (s) = sr + ar−1 sr−1 + · · · + a1 s + a0 (3.516)
o mı́nimo múltiplo comum dos denominadores de gij (s).
Assumindo-se que as raı́zes λi , i = 1..., r do polinômio caracterı́stico são dis-
tintas, pode-se escrever
r
Y
∆ (s) = (s − λi ) (3.517)
i=1
Denote-se
ρi := rank (Ri ) (3.520)
e sejam matrizes Ci e Bi escolhidos de modo que
Ri = Ci Bi (3.521)
Exemplo
Considere a função de transferência
1 2
" #
s+1 s+1
G(s) = 1 1 (3.523)
− (s+1)(s+2) s+2
Portanto,
ρ1 = 2 (3.527)
ρ2 = 1 (3.528)
e " # " #
0 0 0 h i
R2 = = 1 1 (3.530)
1 1 1
B2
C2
Para verificação, basta calcular C (sI − A)−1 B. Além disso, pode-se verificar
que a representação é completamente controlável e observável, ou seja, é mı́-
nima.
Para sistemas de 1 entrada e 1 saı́da, G(s) é 1 × 1, tem-se que
cálculo de variações é atribuı́do a Sir Isaac Newton PRS (1642-1727) por ter
resolvido o problema de obter o perfil de uma figura geométrica de revolução
que oferecesse a mı́nima resistência ao movimento em um fluido, em 1687.
Em 12 de agosto de 1755, Joseph-Louis Lagrange (Giuseppe Luigi Lagrangia,
1736-1813) escreveu uma carta a Euler, apresentando um novo método para
resolver os problemas na obra Methodus inveniendi lineas curvas maximi mi-
nimive proprietate gaudentes sive solutio problematis isoperimetrici latissimo
sensu accepti de Euler, escrito em 1744 e editado por Marcum-Michaelem
Bousquet.
3.15 Exercı́cios
3.15.1 Exercı́cio: Sistema eletromecânico
Os sistemas micromecânicos (MEMS) são, em geral, baseados em efeitos elé-
tricos ao invés de dispositivos maiores que se valem de efeitos magnéticos.
Se o dielétrico é o ar, a rigidez dielétrica é da ordem de 3E6V /m resultando
E e = 12 ε0 E 2 ∼ 40 J.m−3 .
Por outro lado, utilizando indutores com núcleo de ferro, considerando satu-
ração a 1.6 W b.m−2 , tem-se Em = 2µ1 0 b2 850 J.m−3 .
Assim, dispositivos baseados em efeitos elétricos são interessantes para dispo-
sitivos de pequenas dimensões, como os manufacturados com tecnologia mi-
croeletrônica. Neste exercı́cio, busca-se obter um matemático na forma de um
sistema de equações diferenciais ordinárias para o sistema ilustrado em 3.33
124 Engenharia de controle
1 1 1
Tele = Lq̇ ; Vele = (q̇)2 ; Rele = R (q̇)2 (3.539)
2 2C(x) 2
Figura 3.34: (a) Modelo simplificado de uma ponte rolante; (b) modelo sim-
plificado para um objeto suspenso por uma fixação elástica.
Modelos dinâmicos 125
1.
d2 y
2 + 7ẏ + 3y = 0 (3.540)
dt2
y (0) = 1 (3.541)
ẏ (0) = 0 (3.542)
2.
ẏ + 3y = δ (t) (3.543)
y (0) = 0 (3.544)
3.
ẏ + 3y = u (t) (3.545)
y (0) = 0 (3.546)
4.
5.
1
ẏ + 3y = sin t (3.549)
10
y (0) = 0 (3.550)
6.
ẏ + 3y = e−3 (3.551)
y (0) = 0 (3.552)
126 Engenharia de controle
transformador, tem-se
v1 = sL11 i1 + sM i2 (3.553)
v2 = sM i1 + sL22 i2 (3.554)
1.
s+1
G (s) = (3.559)
(s + 0.1) (s + 10)
2.
9
G (s) = (3.560)
s2 + 0.6s + 9
3.
1
G (s) = (3.561)
s (s + 1)
4.
1
G (s) = (3.562)
s (s − 1)
5.
10
G (s) = (3.563)
s2 + s + 1 (s + 10)
Modelos dinâmicos 129
6.
10
G (s) = (3.564)
(s + 1) (s + 10)
7.
10 (s + 1)
G (s) = (3.565)
(s + 2) (s + 5)
8.
2 (s + 1)
G (s) = (3.566)
(s + 2)
9.
(s + 2)
G (s) = (3.567)
(s + 1)
10.
(1 − s)
G (s) = (3.568)
(s + 1)
11.
9 s2 + 0.2s + 1
G (s) = (3.569)
s s2 + 1.2s + 9
12.
s (s − 1)
G (s) = (3.570)
(s + 2)2 (s + 5)
13.
10(1 − s)
G(s) = (3.571)
s2 (s + 5)
14.
ẋ = Ax + Bu (3.572)
y = x1 (3.573)
" #
0 1
A = (3.574)
−25 −4
" #
1
B = (3.575)
1
15.
100e−0.5s
G(s) = (3.576)
s (s + 1)
130 Engenharia de controle
é dado por Y
det (V) = λj − λi (3.604)
1≤i<j≤n
(b) Apresentar uma aplicação desse resultado em problemas de sistemas de
controle.
d3 y d2 y dy dyu
3
+6 2 +8 = 2u + (3.630)
dt dt dt dt
s + 10
G(s) = 100 (3.631)
s3 + 30s2 + 300s + 1000
h iT
sabendo-se que x(0) = 0 1 .
Modelos dinâmicos 137
ci = cnom
i + ∆ci ; i = 1, 2 (3.638)
sendo cnom
i o valor nominal informado pelo fabricante e ∆ci a incerteza devida
à fabricação.
138 Engenharia de controle
Marca cnom
1 ∆c1 cnom
2 ∆c2
“The events in our lives happen in a sequence in time, but in their sig-
nificance to ourselves they find their own order the continuous thread
of revelation.”
– Eudora Welty
y[k] = f ( y[k − 1], y[k − 2], ..., y[k − n], u[k], u[k − 1], u[k − 2], ..., u[k − m], k )
(4.1)
O maior atraso em y é a ordem da equação a diferenças, no caso, n.
139
140 Engenharia de controle
Definindo-se os polinômios
A condição b0 = 0 significa que não há resposta instantânea y[k] a uma exci-
tação u[k].
h iT
Seja o vetor xk = x1 [k] x2 [k] x3 [k] x4 [k] , obtido mediante a associa-
ção
x4 [k] = −a1 x4 [k − 1] − a2 x3 [k − 1] − a3 x2 [k − 1] − a4 x1 [k − 1] +
+b1 u[k − 1] (4.15)
e dadas
o modelo será estável se |λi (An×n ) | < 1 ; i = 1, 2, ..., n ou, em outras palavras,
se todos os autovalores de A estiverem contidos no cı́rculo unitário no plano
complexo.
Se a saı́da de interesse é dada por y[k] = Cx[k], então
k−1
X
y[k] = CAk x0 + CAk−1−i Bu[i] (4.26)
i=0
k−1
X
y[k] ≤ M2 M1 = k M 2 M1 < ∞ (4.31)
i=0
de modo que se
h i
ρ B AB · · · An−2 B An−1 B =n (4.33)
144 Engenharia de controle
pode-se determinar a lei de controle desejada u[0], u[1], ..., u[n − 1] .
Porém, deve se ter cuidado, pois, por definição, controlabilidade se refere
à capacidade de levar qualquer estado x0 à origem.
O modelo, x[k + 1] = 0n×n x[k] + Bn×1 u[k], segundo essa definição é contro-
lável (logo, o termo atingibilidade é preferı́vel em alguns casos).
4.1.4 Observabilidade
A verificação da observabilidade (capacidade de determinar x0 a partir de
medidas y[i], i = 1, 2, ..., n) também é imediata.
Por simplicidade, seja {u[i]} ≡ 0 e assuma que são fornecidas n medições,
4.2 Transformadas Z
A solução de equações diferenciais ordinárias invariantes no tempo que mode-
lam processos LTI pode ser estudada com o uso de transformada de Laplace.
No caso de processos de tempo discreto, modelado por equações a diferenças,
utiliza-se a transformada Z.
Dada uma sequência
{ f[k] }k=0,1,2,... a transformada Z (convenciona-se, usual-
mente, denotar Z f [k] por F (z)) é definida por
∞
f [k]z −k
X
Z f [k] = (4.37)
k=0
O conceito de funções geradoras era conhecido há longa data (de Moivre, 1730)
e foi reintroduzido em 1947 por Witold Hurewicz, sendo batizado de transfor-
mada Z por Ragazzini, J.R. e Zadeh, L.A. da Universidade de Columbia em
1952.
• Transformada da potenciação:
ou seja,
X(z) = (zI − A)−1 x0 + (zI − A)−1 BU (z) (4.55)
Lembrando que y = Cx, tem-se que Y (z) = CX(z) e o modelo é descrito no
domı́nio transformado por
Y (z)
G(z) = (4.60)
U (z)
= C (zI − A)−1 B (4.61)
z+1
= 2
(4.62)
z − 0.9 z + 0.2
148 Engenharia de controle
• Z −1 u[k] = 1
1−z −1
(degrau unitário)
h i
• Z −1 ak u[k] = 1
1−az −1
h i
az −1
• Z −1 kak u[k] = (1−az −1 )2
1−z −1 cos(w)
• Z −1 cos(kω)u[k] =
1−2z −1 cos(w)+z −2
z −1 sin(w)
• Z −1 sin(kω)u[k] =
1−2z −1 cos(w)+z −2
Exemplo
1
Seja um processo cuja função de transferência é G(z) = z 2 −0.3z−0.1
e a entrada
u[k] é um degrau unitário.
z
Lembrando que Z[u[k]] = z−1 , tem-se que
1 z
Y (z) = (4.64)
z 2 − 0.3z − 0.1 z − 1
z
= (4.65)
(z − 0.5)(z + 0.2)(z − 1)
−1.4286 −0.2381 1.6667
= + + (4.66)
z − 0.5 z + 0.2 z−1
z
Pela tabela, Z[ak ] = z−a , de modo que
4.6 Exercı́cios
4.6.1 Exercı́cio: Sequência de Fibonacci
Considere a equação a diferenças (que gera a sequência de Fibonacci)
1.
z(z − 1)
E(z) =
z2 − 1.25z + 0.25
2.
z
E(z) =
z 2 − 2z + 1
3.
z
E(z) =
(z − 1)(z + 1)
4.
0.5z
E(z) =
(z − 1)(z − 0.5)
5.
0.5
E(z) =
(z − 1)(z − 0.5)
6.
0.5(z + 2)
E(z) =
(z − 1)(z − 0.5)
7.
0.5
E(z) =
(z + 0.5)(z − 0.5)2
8.
0.5(z + 0.5)
E(z) =
(z − 0.5)3
152 Engenharia de controle
Identificação de modelos
153
154 Engenharia de controle
por
1 1 x−µ 2
fX (x) = √ e− 2 σ (5.4)
σ 2π
4. Uma sequência i.i.d. de variáveis aleatórias { X[0], X[1], . . . } é aquela
em que X[i] e X[j] possuem distribuições idênticas e, além disso, X[i] e
X[j] são variáveis aleatórias independentes, ∀i ̸= j.
Suponha
que os registros
dos sinais
de saı́da e da entrada, respectivamente,
y[0], ..., y[N ] e u[0], ..., u[N ] com N ≫ n são fornecidos.
Então, empilhando-se as expressões 5.8 com y[N ] no topo e decrescendo até
y[n], tem-se que
h iT
Y= y[N ] y[N − 1] · · · y[n]
h iT
θ= a1 · · · an b0 · · · bm (5.9)
h iT
W= w[N ] w[N − 1] · · · w[n] (5.10)
−y[N − 1] · · · −y[N − n] u[N ] · · · u[N − m]
−y[N − 2] · · · −y[N − n − 1] u[N − 1] · · · u[N − m − 1]
A=
.. .. .. ..
. . . .
−y[n − 1] · · · −y[0] u[n] · · · u[n − m]
(5.11)
tem-se a representação compacta
Y = Aθ + W. (5.12)
A expressão de θ
b que minimiza o erro quadrático é, portanto,
−1
b = AT A
θ AT Y (5.17)
h i −1
E θ
b = E AT A AT Y (5.18)
−1
= E AT A AT Aθ + W (5.19)
−1 −1
= E AT A AT A θ + AT A W (5.20)
−1 −1
: 0 (5.21)
= E AT A AT A θ + AT A E[W]
= θ (5.22)
• Teorema de Gauss-Markov:
A estimativa obtida pelo MQE, θ, b é ótima na classe de estimadores
lineares não polarizados (ou se θ̌ = ǍY tal que E[θ̌] = θ, ∀θ, então
b ≤ cov(θ̌)).
cov(θ)
Note, inicialmente, que
Faça-se a associação
bi − θi N −m+1
θ 1 X
u= √ e v= 2 b 2
w[k] (5.47)
pii σ k=1
u bi − θi
θ 1
q = √ r (5.48)
v σ pii 1
PN −m+1
b 2
w[k]
N −m σ2 k=1
N −m
bi − θi
θ 1
= √ rP (5.49)
pii N −m+1
b 2
w[k]
k=1
N −m
bi − θi
θ
= √ ∼ tN −m (5.50)
pii σ
b
160 Engenharia de controle
T P a
uma vez que ak+1 k k+1 é um escalar.
Por outro lado,
−1
θ[k
b + 1] = ATk+1 Ak+1 ATk+1 Yk+1 (5.60)
" #
−1 h i Yk
= ATk+1 Ak+1 ATk ak+1 (5.61)
y[k + 1]
" #
−1 h i Yk
= ATk Ak + T
ak+1 ak+1 ATk ak+1 (5.62)
y[k + 1]
T
Pk ak+1 ak+1
= I − Pk ATk Yk + ak+1 y[k + 1] (5.63)
1 T
+ ak+1 Pk ak+1
T
Pk ak+1 ak+1
= I − θ[k] + Pk ak+1 y[k + 1] (5.64)
b
1 T
+ ak+1 Pk ak+1
Pk ak+1
T b
= θ[k]
b + y[k + 1] − ak+1 θ[k] (5.65)
T P a
1 + ak+1 k k+1
já que
escalar escalar
z }| { z }| {
T T
ak+1 Pk ak+1 Pk ak+1 y[k + 1] = Pk ak+1 ak+1 Pk ak+1 y[k + 1] (5.67)
162 Engenharia de controle
Definindo-se
−1
T
Kk+1 = Pk Ak+1 1 + ak+1 Pk ak+1 (5.68)
inovação
z }| {
T b
θ[k
b + 1] = θ[k]
b +K
k+1 y[k + 1] − ak+1 θ[k] (5.69)
Observação:
Pk ak+1
T b
θ[k
b + 1] = θ[k]
b + y[k + 1] − ak+1 θ[k] (5.71)
T P a
1 + λ ak+1 k k+1
Exemplo
em que x[k] é n × 1.
Supondo x[k] e {u[k]} conhecidos, pode-se escrever
YN = VN x[k] + HN UN (5.87)
Embora existam métodos não paramétricos, como o dos casos que empregam
redes neurais artificiais, que permitem casar modelos (model matching )
à relação entre os registros de entradas e saı́das, esta seção buscou a iden-
tificação de parâmetros de modelos na forma de equações a diferenças. É
importante ressaltar que uma identificação acurada e precisa requer ade-
quada quantidade de informações também acuradas e precisas.
5.5 Exercı́cios
5.5.1 Exercı́cio: Ajuste de retas usando o método de mı́nimos qua-
drados
Assuma que em algum experimento de laboratório é sabido que
y = ax + b (5.92)
em que x ∈ R e y ∈ R.
Repetindo-se o experimento N vezes, obtém-se um conjunto de pares entrada-
saı́da
C = {(x1 , y1 ), (x2 , y2 ), ..., (xN , yN )} (5.93)
Devido a erros de medida, cada par (xi , yi ) possui uma incerteza aditiva wi .
Ao invés de marcar os pontos em um papel milimetrado e ajustar a reta que
mais aproxima esses pontos usando uma régua, mostrar como o método dos
mı́nimos quadrados pode ser utilizado para obter as estimativas a
beb
b.
Observação: O conjunto de medidas satisfaz:
y x w
1 1 " # 1
y2 x2 a w2
. = . + . (5.94)
.. .. b ..
yN xN wN
| {z } | {z }
Y A
k u[k] y[k]
0 1.000000 0.700000
1 0.830258 -0.439742
2 0.933023 0.791610
3 1.110557 -0.094803
4 1.207818 0.519340
5 0.776472 -0.370270
6 1.252132 1.115390
7 1.132029 -0.609886
8 0.986427 0.756670
9 0.960956 -0.181629
10 0.956479 0.448792
11 0.939378 0.021957
12 1.004609 0.376130
Estabilidade
171
6
ẋ = Ax (6.1)
Observação:
Sistemas não lineares podem ter múltiplos pontos de equilı́brio isolados.
Por exemplo, o sistema escalar
ẋ = x − x3 (6.2)
ẋ = Ax ; x(t0 ) = x0 (6.3)
y = Cx (6.4)
173
174 Engenharia de controle
é da forma n
X
y(t) = µk eλk t (6.5)
k=1
e são estáveis se os todos os autovalores λk possuem parte real negativa.
No domı́nio transformado, tal fato se traduz na condição que todos os polos
da função de transferência estão localizados no semiplano esquerdo (SPE).
Uma vez que a obtenção das raı́zes de ∆(s) pode ser trabalhosa, principalmente
quando são envolvidos parâmetros literais, é interessante que se disponha de
métodos para verificar se todas as raı́zes do polinômio caracterı́stico ∆(λ) =
0 estão localizados no semiplano esquerdo (nesse caso, ∆(λ) é dito ser de
Hurwitz).
Neste capı́tulo é tratado apenas o caso SISO (single input single output).
Observação
A pertinência das raı́zes de ∆(s) ao SPE não garante a estabilidade de sistemas
variantes no tempo (sistemas não autônomos).
Considere o sistema cujo modelo é
6.0.2 Exemplo
Seja um processo cuja relação entrada-saı́da é dada, no domı́nio transformado,
por
K
T (s) = 4 (6.17)
s + 2s3 + 6s2 + 4s + K
Para determinar para quais os valores K o sistema é estável, deve-se verificar
quando o polinômio ∆(s) = s4 + 2s3 + 6s2 + 4s + K = 0 tem todas as raı́zes
no semiplano esquerdo (SPE), montando-se o arranjo de Routh-Hurwitz
s4 : 1 6 K
s3 : 2 4
s2 : 4 = 2×6−1×4
2 K = 2×K−1×0
2 (6.18)
s1 : 4 − 12 K = 4×4−2×K
4
s0 : K
0 < amin
i ≤ ai ≤ amax
i (6.20)
para i = 1, ..., n.
Sejam ainda os conjuntos de coeficientes organizados como a seguir
n o
P = amax
0 , amin max min
2 , a4 , a6 , ... (6.21)
n o
P = amin max min max
0 , a2 , a4 , a6 , ... (6.22)
n o
I = amax
1 , amin max min
3 , a5 , a7 , ... (6.23)
n o
I = amin max min max
1 , a3 , a5 , a7 , ... (6.24)
Critério de Kharitonov Todos os polinômios ∆[ a0 , a2, ... , a1 , a3, ... ](s) serão
Hurwitz se os seguintes quatro polinômios forem Hurwitz
∆[P , I](s), ∆[P , I](s), ∆[P , I](s), ∆[P , I](s) (6.25)
A prova desse resultado pode ser encontrado no artigo original de (KHARI-
TONOV, 1978), ou em (YEUNG; WANG, 1987).
6.0.4 Exemplo
Suponha que, em vista de incertezas nos valores dos componentes utilizados,
tem-se que
∆(s) = (1 ± 0.05)s4 + (2 ± 0.2)s3 + (6 ± 0.3)s2 + (4 ± 0.1)s + (5 ± 0.4) (6.26)
ou seja,
a0 ∈ [0.95, 1.05] (6.27)
a1 ∈ [1.8, 2.2] (6.28)
a2 ∈ [5.7, 6.3] (6.29)
a3 ∈ [3.9, 4.1] (6.30)
a4 ∈ [4.6, 5.4] (6.31)
Critérios de estabilidade para modelos LTI 177
forem Hurwitz.
6.0.6 Exemplo
Considere o problema de determinar o valor de ganhos K de modo que o
processo do diagrama de blocos da figura 6.1 seja estável.
em que
z
G(z) =
z2 + 0.7z + 0.1
Fazendo-se a substituição
1+w
z= (6.38)
1−w
obtém-se no plano W que
5K(1 − w2 )
G(w) = (6.39)
(2 − 5K) w2 + 9w + 5K + 9
Z = N [−1, ⟳] + P (6.40)
Ga (s)
Gf (s) = (6.41)
1 + Ga (s)
possui zeros no SPE (lembrando que zeros de 1 + Ga (s) são os polos de Gf (s)).
Na condição representada por 6.40, verifica-se o enlaçamento do ponto −1 e
tomando f (s) = Ga (s) ao invés de se fazer f (s) = 1 + Ga (s), que, em verdade,
é uma simples translação de 1.
Como s tais que 1+Ga (s) = 0 são os polos de malha fechada Gf , Z é associado
ao polo de malha fechada, enquanto P é associado a polos de Ga , pois, se
G(s) → ∞, então f (s) → ∞.
Como se deseja verificar se há polos de Gf no SPE, busca-se demarcar o SPD
usando o contorno de Nyquist, ilustrado na figura 6.3.
N = Z −P (6.43)
1 = Z −1 (6.44)
N = Z −P (6.45)
1 = Z − (−1) (6.46)
1
G(s) = K (6.47)
s+a
e, portanto, considerando s = jω, um ramo começa para ω = 0 no ponto a1 e
tende para a origem à medida que ω → ∞, aproximando com ângulo de −90o
Critérios de estabilidade para modelos LTI 181
1
(intuitivamente jM ≃ −jϵ, se M for muito grande, já que jM + a ≃ jM ).
Note-se que, para qualquer valor de K > 0, a imagem do contorno de Nyquist
não enlaça o ponto crı́tico −1, sendo, portanto, estável.
1
G(s) = K (6.48)
s(s + 1)(s + 2)
e, portanto, se s = jω = jϵ, então G(jω) tem como seu denominador,
jϵ(jϵ + 1)(jϵ + 2) ≃ 2jϵ.
Ou seja, |G(jω)| ≃ −jM com M “muito grande”.
Na figura à direita de 6.5, esse fato é representado pelo inı́cio do ramo no ponto
A.
Para ω → ∞ tem-se que |G(jω)| → 0 aproximando-se da origem pelo ângulo
de −270o , correspondendo a j13 .
Note-se que se o ganho K for aumentado, vai haver, eventualmente, o enlaça-
mento do ponto crı́tico −1, significando que a partir de um certo valor de K
o sistema será instável.
182 Engenharia de controle
situação GM A (jω0 ) = 1, de modo que o sistema continua estável, quando a
malha for fechada com realimentação unitária.
As margens de ganho e de fase podem ser obtidas graficamente das curvas de
Nyquist, Bode e na carta de Nichols, como visto na figura 6.9.
Figura 6.9: Leitura direta das margens de ganho e de fase das curvas de
Nyquist, Bode e da carta de Nichols.
No
caso de um sistema de segunda ordem caracterizado por (ξ, ωn ), a condição
GM A (jω0 ) = 1 ocorre para
rq
ω0 = ωn 1 + 4ξ 4 − 2ξ 2 (6.50)
Uma aproximação útil para γ (em graus) que vale para ξ pequeno é
γ = 100 × ξ (6.52)
ẋ = Ax + Bu (6.53)
y = Cx (6.54)
No caso de ser ter uma entrada não nula mas limitada, ou seja,
u(t) ≤ Umax < ∞ (6.56)
tem-se que Z t
y(t) = CeA(t−τ ) Bu(τ )dτ (6.57)
0
Em cada instante de tempo t, nota-se que
Z
t
A(t−τ )
y(t) =
Ce Bu(τ )dτ
(6.58)
0
Z t
A(t−τ )
≤ Ce Bu(τ ) dτ (6.59)
0
Z t
A(t−τ )
≤ Ce BUmax dτ (6.60)
0
Z t
A(t−τ )
≤ Ce B dτ Umax (6.61)
0
e, portanto, se
Z t
A(t−τ )
Ce B dτ < M ; ∀t ≥ 0 (6.62)
0
a saı́da y será limitada
y(t) ≤ M Umax < ∞ ; ∀t ≥ 0 (6.63)
186 Engenharia de controle
Diz-se, nesse caso, que o sistema é BIBO estável (Bounded Input Bounded
Output).
Lembrando que a resposta impulso é dada por y(t) = CeAt B, depreende-se
de 6.62 que o sistema é BIBO estável se a resposta impulso é limitada, o que
acontece se todos os autovalores de A estiverem no semiplano esquerdo.
6.3 Exercı́cios
6.3.1 Exercı́cio: Critério de Routh-Hurwitz
Estudar o comportamento quanto à estabilidade, em função do parâmetro
K ∈ (0, ∞):
1.
Ks
G (s) = (6.64)
s2 − 2s + 2
2. √
(s + 1) s + 3
G (s) = K (6.65)
(s − 1) s2 + 1
3.
(s + 1) (s + 2)
G (s) = K (6.66)
s (s − 1) (s + 3)
4.
s+2
G (s) = K (6.67)
s2 − 1
5.
Ks
G (s) = (6.68)
s2 + 2s + 2
188 Engenharia de controle
6.
s+1
G (s) = K (6.69)
s2 + 1
7. h i
(s + 1) (s + 1)2 + 1
G (s) = K (6.70)
s (s − 1) s2 + 1
8.
(s + 1) (s + 2)
G (s) = K (6.71)
(s − 1) s2 + 2
9.
(s + a)
G (s) = K (6.72)
s2 (s+ b)
para os casos a > b > 0, b > a > 0 e ab < 0
10.
(s + 1) (s + 2) (s + 3)
G (s) = K 2 (6.73)
s2 + 1
11.
(s + 2)2
G (s) = K (6.74)
s (s − 1)
12.
(s + 1)2
G (s) = K (6.75)
s4
13.
(s + 1)2
G (s) = K (6.76)
s3
14.
(1 − s)
G (s) = K (6.77)
(s + 1) (s + 10)
15.
(s + 1)2
G (s) = K (6.78)
s s2 − 2s + 2
16.
(s + 5) (s + 40)
G (s) = K (6.79)
s3 (s + 100) (s + 200)
Critérios de estabilidade para modelos LTI 189
17.
s2 + 2s + 5
G (s) = K (6.80)
s (s + 4) (s + 5) (s + 1)2
18.
K (s + 1)2
(6.81)
s3 (s + 6)2
19.
(5 − s)
G (s) = K (6.82)
(s + 1) (0.2s + 1)
20.
K (s + 1)2
G (s) = (6.83)
s3
21.
K (1 − s)
G (s) = (6.84)
(s + 1) (s + 2)
22.
K (s + 1)
G (s) = (6.85)
s s3 + 3s2 + 12s − 16
23.
K
G (s) = (6.86)
s (s − 1)
24.
K (1 − s) e−0.1s
G (s) = (6.87)
s (s + 1)
d3 y d2 y dy
3
+ 3 2
+2 = u (6.91)
dt dt dt
dy
u = −KP y − KD (6.92)
dt
∆(s) = s3 + a1 s2 + a2 s + a3 (6.111)
Qual o maior valor da incerteza α admissı́vel para que essa famı́lia de modelos
permaneça estável?
a1 = 6 (6.112)
a2 = 11 (6.113)
a3 = 6 ± α (6.114)
(6.115)
1.
1
G(s) = 12
(s + 1)(s + 2)(s + 3)
2.
1
G(s) = 12
s(s + 2)(s + 3)
3.
s+3
G(s) = 12
(s + 1)(s + 2)(s + 4)(s + 5)
e−T s
G (s) = (6.116)
s+1
Qual é o máximo valor admissı́vel para T de modo que o sistema, ao ser
realimentado unitariamente, ainda seja estável?
7
Métodos de Lyapunov
Esta seção busca apresentar duas classes de métodos para análise da estabili-
dade proposta por Alexandr Mikhailovich Lyapunov, cujo trabalho foi publi-
cado em 1892 e possui diversas traduções (LYAPUNOV, 1992).
Aqui serão tratados apenas os casos de sistemas de tempo contı́nuo, embora
existam adaptações para os casos de tempo discreto.
Os métodos de Lyapunov permitem a investigação da estabilidade de sistemas
não lineares não autônomos (invariantes no tempo) ou não.
Em particular, sistemas lineares não autônomos são também tratáveis pelos
métodos de Lyapunov, o que não é possı́vel com métodos baseados na locali-
zação dos polos.
Os métodos de Lyapunov são também úteis para mitigar os problemas de in-
certezas na modelagem, mesmo quando o processo controlado é modelado por
sistemas LTI, como o caso da utilização de controle adaptativo.
Um aspecto teórico interessante, nesse enfoque, é a validade do método de
aproximação utilizando a expansão em série de Taylor de f (x, u) para o es-
tudo da estabilidade, bem como para o projeto de controladores.
193
194 Engenharia de controle
ẋ = f (x, u) (7.1)
f (xE , uE ) = 0 (7.2)
ẋ1 = x2 (7.4)
g
ẋ2 = − sin (x1 ) (7.5)
L
Os pontos de equilı́brio são da forma (kπ, 0), k =
0, 1, 2, ... e a matriz A indicado em 7.3 é dada por
" #
0 1
A= (7.6)
− Lg cos (x1 ) 0
x1 =kπ
Exemplo preliminar
Considere, para efeito de ilustração preliminar, o mesmo pêndulo visto ante-
riormente, mas agora com um coeficiente de atrito viscoso b > 0,
d2 θ dθ
mL +b + mg sin θ = 0 (7.9)
dt2 dt
em que θ é o ângulo entre a haste do pêndulo e a vertical.
As energias cinética e potencial são dadas, respectivamente, por
!2
1 dθ
Ec = mL2 (7.10)
2 dt
Ep = mgh (7.11)
= mgL(1 − cos θ) (7.12)
ET = Ec + Ep (7.13)
e, se o atrito é nulo,
!2
dθ dθ
−L b=0⇒ =0 (7.15)
dt dt
V (x) = xT Qx (7.16)
em que Qn×n é uma matriz simétrica.
Se essa expressão resultar em uma função V positivo definida, então Q é dita
ser positivo definida e denotada Q ≻ 0.
Um teste útil para verificar a positividade de uma matriz é que todos os
menores principais de Q sejam positivos (critério!de Sylvester )
ẋ = f (x) (7.21)
f (0) = 0 (7.22)
• contı́nua em relação a t
dV (x(t))
• dt = Vx ẋ é negativo semidefinida
em B(0, ρ) Figura 7.2: Relação entre a
curva de nı́vel de V e as vizi-
Esboço da prova nhanças envolvidas na prova do
o
Por definição, um ponto de equilı́brio 0 é es- 2 método de Lyapunov.
tável se dado ε > 0 arbitrário, ∃ δ(ε) > 0 tal
que x(t0 ) ∈ B(0, δ) ⇒ x(t) ∈ B(0, ε).
Assuma que é dado um ε > 0 e seja ∂B(0, ε)
a fronteira de B(0, ε), como ilustrada na figura 7.2.
Seja Vmin o mı́nimo de V (x) para x ∈ ∂B(0, ε) e note que V (x) < Vmin ⇒ x ∈
B(0, ε).
Seja δ tal que ∀x ∈ B(0, δ), V (x) < Vmin . Se x(t0 ) ∈ B(0, δ), então
V (x(t)) < Vmin para t ≥ t0 , pois dV (x(t))
dt ≤ 0 e V (x(t0 )) ≤ V (x(t)) para
t ≥ t0 .
Portanto x(t) ∈ B(0, ε), ∀t ≥ t0 .
Métodos de Lyapunov 199
Observações
• Uma função V que satisfaz as condições (i) a (iii) é chamada de função
de Lyapunov.
• Situações em que V (x) = 0 em uma certa região podem, às vezes, serem
tratadas pelo princı́pio de La Salle (vide, por exemplo, (SLOTINE; LI,
1991), (KHALIL, 1992)).
ẋ = −σ(x) (7.23)
V (x) = x2 (7.24)
dV (x(t)) dx
= 2x(t) (7.25)
dt dt
= −2 x(t) c x(t) ≤ 0 (7.26)
fm = g(x) (7.27)
fa = h(ẋ) (7.28)
200 Engenharia de controle
ẋ = f (x(t), t) (7.51)
f (0, 0) = 0 (7.52)
• V é decrescente
• d
dt V (x(t)) é negativo semidefinida em B(0, ρ)
dJ d tf 1
Z
2
= y(t) − θu(t) dt (7.56)
dθ dθ t0 2
1 tf d h 2
Z i
= y (t) − 2θy(t)u(t) + θ2 u2 (t) dt (7.57)
2 t0 dθ
1 tf h
Z i
= −2y(t)u(t) + 2θu2 (t) dt (7.58)
2 t0
= 0 (7.59)
Identificação recursiva
Técnicas de estimação que utilizam todos os dados {u(τ ), y(τ )}τ ∈ [ t0 ,tf ] de
uma vez só são conhecidas como de “batelada”, em contraste as “recursivas”que
utilizam em cada instante t ≥ 0, os dados {u(τ ), y(τ )}τ ≤t .
Se o instante presente é t = tf , em vista de 7.60, tem-se que θ(t)
b é dado por
Z t Z t
θ
b (t) u2 (τ )dτ = y(τ )u(τ )dτ (7.61)
t0 t0
204 Engenharia de controle
Persistência da excitação
Se o sinal u(t) for identicamente nulo, tem-se na equação que descreve a dinâ-
mica de θ(t)
b a situação 00 , o que não é permitido.
Logo, a entrada u(t) deve afetar suficientemente o sistema de forma que pos-
sam ser estabelecidas relações entre as entradas u e as saı́das y.
Uma entrada u com tais caracterı́sticas é chamada de persistentemente exci-
tante.
Um exemplo de sinal persistentemente excitante é, u(t) = δ(t − t0 ),
Z t Z t
u2 (τ )dτ = δ 2 (τ − t0 )dτ = 1 (7.64)
t0 t0
Conceito de consistência
b é obtido de
O ponto de equilı́brio da equação para θ
−u2 (t)θ(t)
b + y(t)u(t) = 0 (7.66)
2
−u (t)θ(t)
b + θu(t)u(t) = 0 (7.67)
θ(t)
b = θ (7.68)
Em vista de θ ser constante, se ϕ(t) é definido como ϕ(t) = θ(t)
b − θ, tem-se
que
ϕ̇ = θḃ (7.69)
e, lembrando que y = θu, obtém-se uma EDO para ϕ
ϕ̇ = θ
ḃ (7.70)
b 2 + yu
= −θu (7.71)
b 2 + θu2
= −θu (7.72)
2
= −ϕu (7.73)
Métodos de Lyapunov 205
Convergência da estimativa
˙ = −ϕu2 , adote a função candidata de
Para estudar a estabilidade de ϕ(t)
Lyapunov
V = ϕ2 (7.74)
Derivando-se V em relação a t, resulta
d 2
V̇ = ϕ (7.75)
dt
= 2ϕϕ̇ (7.76)
2 2
= −2ϕ u (7.77)
x
ḃ = a
bx bu
b+b (7.79)
b(t) → a e b
e tome-se como meta fazer a b(t) → b, para t → ∞.
Nessas condições, o erro e(t) = x(t) − x
b(t) satisfaz
ė = (ax + bu) − a
bx bu
b+b (7.80)
ϕ(t) = a − a
b(t) (7.82)
ψ(t) = b − bb(t) (7.83)
206 Engenharia de controle
1. No instante inicial, V (e(0), ϕ(0), ψ(0)) < N para algum N > 0. Como
V̇ ≤ 0, decorre que as funções e(t), ϕ(t) e ψ(t) são limitadas.
ḃ = A
x bxb + Bu
b (7.101)
e(t) = x(t) − x
b (t) (7.102)
Φ(t) = A − A
b (7.105)
Ψ(t) = B−B
b (7.106)
ė = Ae + Φ(t)x
b + Ψ(t)u (7.107)
Ȧ = Φ̇ (7.108)
Ḃ = Ψ̇ (7.109)
208 Engenharia de controle
AT P + PA = −Q (7.115)
para algum Q ≺ 0.
A solução P de 7.115 é única e positivo definida pois, por hipótese, A possui
todos os autovalores no semiplano esquerdo.
Os termos indesejados em 7.114 são eliminados adotando-se as leis de adapta-
ção
bT
Φ̇ = −Pex (7.116)
T
Ψ̇ = −Peu (7.117)
7.4 Backstepping
Embora o backstepping tenha sido estudado de modo implı́cito em alguns
artigos anteriores, a formulação tı́pica vista hoje em dia é devida a
• Sussmann, H. J. e Kokotovic, P. V. The peakingphenomenon and the
global stabilization of nonlinear systems. IEEE Transactions on Auto-
matic Control, v. 36, n. 4, p. 424-440, 1991.
Para se ter uma boa perspectiva sobre o tema, recomenda-se o artigo
• Kokotovic, P. V. (1992). The joy of feedback: nonlinear and adaptive.
IEEE Control Systems Magazine, v. 12, n. 3, p. 7-17, 1992.
210 Engenharia de controle
ẋ1 = x31 v
e = x2 − q(x1 ) (7.131)
x2 = e + q(x1 ) (7.132)
Por outro lado, como ẋ2 = u, pode-se escre3ver a partir de 7.131 que
ė = u − q̇(x1 ) (7.136)
Fazendo-se
u = q̇(x1 ) − x41 − e
obtém-se que
d
V2 (x1 , e) = −x61 + x41 + u − q̇(x1 ) e (7.146)
dt
= −x61 − e2 < 0 (7.147)
e o modelo original foi estabilizado com o controle
u = q̇(x1 ) − x41 − e (7.148)
= q̇(x1 ) − x41 − x2 + q(x1 ) (7.149)
= −2x1 ẋ1 − x41 − x2 − x21 (7.150)
= −x41 − 2x41 x2 − x21 − x2 (7.151)
d dV1
V2 (x1 , e) = ẋ1 + eė (7.158)
dt dx1
dV1 h i
= f (x1 ) + g(x1 ) e + q(x1 ) + e u − q̇(x1 ) (7.159)
dx1
dV1 dV1
= f (x1 ) + g(x1 )q(x1 ) +
dx1 dx1
| {z }
V˙1 <0
" #
dV1
+ g(x1 ) + u − q̇(x1 ) e (7.160)
dt
| {z }
B
Fazendo-se
dV1
u=− g(x1 ) + q̇(x1 ) − e
dx1
obtém-se que
V2 (x1 , e) = V˙1 − e2 < 0
Expandindo o controle estabilizante u, obtém-se a fórmula
dV1
u = − g(x1 ) + q̇(x1 ) − e (7.161)
dx1
dV1 dq
= − g(x1 ) + ẋ1 − x2 + q(x1 ) (7.162)
dx1 dx1
dV1 dq
= − g(x1 ) + f (x1 ) + g(x1 )x2 − x2 + q(x1 ) (7.163)
dx1 dx1
dV1 dq dq
= − g(x1 ) + f (x1 ) + g(x1 )x2 − x2 + q(x1 ) (7.164)
dx1 dx1 dx1
Exemplo: Considere o mesmo modelo utilizado anteriormente
Os termos gk (x1 , ..., xk ) não devem se anular pois a solução envolve termos
gk−1 (x1 , ..., xk ).
Exemplo de ordem 2
Considere o problema de estabilizar o sistema modelado por
e2
V2 (x1 , e) = V1 (x1 ) + (7.179)
2
obtém-se que (omitindo-se os argumentos de f1 , f2 , g1 e g2 )
d dV1
V2 (x1 , e) = ẋ1 + eė (7.180)
dt dx1
dV1 h i
= f1 + g1 e + q(x1 ) + e f2 + g2 u − q̇(x1 ) (7.181)
dx1
dV1
= f1 + g1 )q(x1 ) +
dx1
| {z }
V̇1 <0
dV1
+e[ g1 + f2 + g2 u − q̇(x1 )] (7.182)
dx1
De modo similar aos casos anteriores, propõe-se a lei de controle
!
1 dV1
u = − g1 + f2 − q̇(x1 ) + e (7.183)
g2 dx1
!
1 dV1 dq1 dq1
= − g1 + f2 − f1 − g1 x2 + x2 − q(x1 ) (7.184)
g2 dx1 dx1 dx1
e = x2 − q1 (x1 ) (7.190)
x2 = e + q1 (x1 ) (7.191)
e obtém-se o sistema
V̇ = x1 ẋ1 + eė + θ
eθė (7.203)
tem-se que
V̇ = x1 θf (x1 ) + e + qb1 (x1 ) + e u − qḃ1 (x1 ) + θ
eθė (7.204)
b (x1 ) + e u − qḃ (x1 ) + θ
= x1 θf (x1 ) + e − x1 − θf 1
eθė (7.205)
h i
= −x21 +
(θ − θ)f (x1 ) + θθ + e x1 + u − qḃ1 (x1 ) (7.206)
b e ė
| {z }
eθ
h i
= −x21 − (f (x1 ) + θ) e + e x1 + u − qḃ (x1 )
ė θ
1 (7.207)
Seja
ė = −f (x1 )
θ (7.208)
u = −x1 + qḃ1 (x1 ) − e (7.209)
218 Engenharia de controle
V̇ = −x21 − e2 ≤ 0
ė = −f (x1 )
θ
e com o controle
Nesta seção, o critério de Lyapunov foi utilizado para obter uma lei de adap-
tação tal que V̇ ≤ 0. Ou seja, a função candidata V envolvia funções ainda
não determinadas (no exemplo, P hi e P si, respectivamente) que, posterior-
mente, foram escolhidas de modo que tornassem V semidefinida negativa.
Aqui, embora o ponto (0, 0) seja atrator, esse não é um ponto de equilı́brio.
7.8 Exercı́cios
7.8.1 Exercı́cio: Estabilidade de pontos de equilı́brio
Investigar a estabilidade dos pontos de equilı́brio da equação de Van der Pol
ẋ1 = −x2 (7.216)
ẋ2 = x1 + x21 − 1 x2 (7.217)
2.
ẋ1 = x31 − x2 (7.220)
ẋ2 = (x21 + x22 − 2) x2 (7.221)
3.
ẋ1 = x21 − x32 (7.222)
ẋ2 = 2x1 (x21 − x2 ) (7.223)
ẋ1 = x2 (7.226)
1
ẋ2 = −x1 + x31 − x2 (7.227)
3
(i) Investigar a estabilidade da origem utilizando o primeiro método de
Lyapunov.
(ii) Investigar a estabilidade da origem utilizando o segundo método de
Lyapunov.
Observação: Uma função candidata de Lyapunov pode ser encontrada
escolhendo-se convenientemente os coeficientes de um polinômio.
x1 = x2 (7.228)
x2 = −g(x1 ) − h(x2 ) (7.229)
em que
g(0) = 0 (7.230)
h(0) = 0 (7.231)
ξg(ξ) > 0 ; −1 < ξ < 1 ; ∀ξ ̸= 0 (7.232)
ξh(ξ) > 0 ; −1 < ξ < 1 ; ∀ξ ̸= 0 (7.233)
ẋ1 = x2 (7.235)
ẋ2 = − sin(x1 ) − x2 (7.236)
1
V (x1 , x2 ) = [1 − cos(x1 )] + x22 (7.237)
2
(ii) o segundo método de Lyapunov com a função candidata
1
V (x) = xT Px (7.238)
2
para uma escolha adequada de P.
ẋ1 = x2 (7.243)
ẋ2 = − sin(x1 ) − g(t)x2 (7.244)
1
V (t, x) = (a sin(x1 ) + x2 )2 + (1 + ag(t) − a2 )(1 − cos (x1 ) (7.245)
2
224 Engenharia de controle
θ̇ = w (7.246)
ẇ = − sin(θ) − aw (7.247)
θ(0) = 1 (7.248)
w(0) = 1 (7.249)
x
ḃ = a
bxb + αf
b (x) + βg(u)
b (7.255)
Definir e = x − x
b ϕ = a−a
b, ψ = α − α,
b χ = β − βb e utilizar a função candidata
1 2
V = e + ϕ 2 + ψ 2 + χ2 (7.256)
2
8
Métodos no domı́nio
transformado
225
226 Engenharia de controle
y = (A + ∆A) u (8.1)
= Au + ∆Au (8.2)
e = u−y (8.8)
y = (A + ∆A) e (8.9)
ou seja,
y = (A + ∆A) (u − y) (8.10)
y (1 + A + ∆A) = (A + ∆A) u (8.11)
A + ∆A
y = u (8.12)
1 + A + ∆A
Quando não há incertezas, a saı́da é dada por
A
ynom = u (8.13)
1+A
e, supondo novamente que a incerteza do modelo é de 10%,
∆A
× 100% = 10% (8.14)
A
tem-se que a saı́da possui um erro percentual de
A+∆A A
y − ynom 1+A+∆A u − 1+A u
× 100% = A
× 100% (8.15)
ynom 1+A u
1 ∆A
= × 100% (8.16)
(1 + A + ∆A) A
1
= 10% (8.17)
1 + A + ∆A
Supondo que foi escolhido o valor A = 100, a equação 8.17 permite escrever
y − ynom 1
× 100% = 10% (8.18)
ynom 1 + 100 ± 10
de modo que o erro percentual da saı́da se situa na faixa
y − ynom
× 100% ∈ [0.9, 1.1] % (8.19)
ynom
y = Au + n (8.20)
ynom = Au (8.21)
y = ynom + n (8.22)
e = u−y (8.23)
y = n + Ae (8.24)
y = n + A(u − y) (8.25)
= n + Au + Ay (8.26)
resulta que
1
y = ynom + n (8.29)
1+A
Fazendo-se A = 100 na expressão 8.29, verifica-se que o ruı́do é atenuado em
aproximadamente 100 vezes,
que é um sinal que cresce indefinidamente (até violar as condições para a va-
lidade do modelo).
De fato, este sistema é instável no sentido “saı́da limitada para entradas
limitadas” (bounded input bounded output - BIBO).
Fazendo-se uma realimentação como ilustrado na parte direita da figura 8.3 e
230 Engenharia de controle
ẏ = e (t) (8.37)
= u(t) − y(t) (8.38)
é
y (t) = 1 − e−t (8.40)
simplicidade).
GP GP GC GP G C
Y = D− N+ R (8.41)
1 + GP G C 1 + GP GC 1 + GP G C
GP 1 1
E = − D− N+ R (8.42)
1 + GP GC 1 + G P GC 1 + GP GC
GP GC GC GC
U = − D− N+ R (8.43)
1 + GP GC 1 + G P GC 1 + GP GC
Para facilitar a notação é conveniente definir o ganho de malha aberta L(s)
GP (s)
Q = (8.47)
1 + L(s)
GC (s)
P = (8.48)
1 + L(s)
1 + L(s) = 0 (8.52)
G(s) = Gnom
P (s) + ∆GP (s) (8.60)
1 ∆GP
= ∥ ∥ (8.66)
1+ Gnom
P GC Gnom
P
ẋ = a(u)x + bu (8.68)
n o
em que a variável entrada u pode assumir apenas dois valores uof f , uon e
(
aon se u = uon
a(u) = (8.69)
aof f se u = uof f
por
dx2
dt
m = dx1
(8.77)
dt (x ,x )
1 2
f2 (x1 , x2 )
= (8.78)
f1 (x1 , x2 ) (x
1 ,x2 )
∆x2
≃ (8.79)
∆x1 (x
1 ,x2 )
ẋ1 = x2 (8.82)
ẋ2 = −5x1 − 6x2 (8.83)
ẋ1 = x2 (8.86)
ẋ2 = −5x1 − 6x2 + 5u (8.87)
y = x1 (8.88)
2. obter o lugar geométrico dos estados em que há comutação do relé liga-
desliga. Observa-se pelo gráfico caracterı́stico do relé que o chaveamento
ocorre para e(t) = 0.
Pelo diagrama de blocos 8.7,
ẋ1 = x2 (8.90)
ẋ2 = u (8.91)
A existência de zona morta significa que valores de e(t) nessa faixa não pro-
duzem ações de controle u(t), significando que pode ocorrer erro de regime.
Por outro lado, muitos sistemas fı́sicos apresentam esse fenômeno.
A figura 8.14 apresenta o caso de relé com histerese que é um fenômeno muito
visto em materiais magnéticos.
No caso do relé com histerese, há um certo atraso na comutação, de modo que
é comum que ocorram oscilações sustentadas.
Se a trajetória fechada é alcançada com a condição inicial no seu interior, ou
fora dele, diz que se trata de um ciclo limite estável.
Nesse problema exemplo, ocorre o fenômeno de ciclo limite estável, e o sistema
apresenta oscilações em torno do valor de referência desejado de 10.
No Apêndice G é apresentado um método de análise aproximado (método
da linearização harmônica, da função descritiva, da primeira harmônica) que
permite estimar a amplitude e a frequência de oscilação, caso esse fenômeno
ocorra, para sistemas LTI acionados por não linearidades estáticas.
como se fosse um ganho linear. Além disso, o ganho será ajustável através
da manipulação da amplitude do sinal de dither tipo triangular de frequência
muito elevada que é utilizado.
Considere a seguinte malha de controle em que a o sinal d é periódico de
frequência muito maior do que os modos do modelo, considerado ser d =
triang(t) de perı́odo T e amplitude D no exemplo considerado.
A figura 8.17 mostra u(t) para três valores diferentes de e(t): Como a
T
: D :: ton : D + E (8.94)
2
T
: D :: tof f : D − E (8.95)
2
Métodos no domı́nio transformado 245
1 T
Z
<u> = u(t)dt (8.96)
T 0
"Z #
1 ton Z T
= M dt − M dt (8.97)
T 0 ton
" #
1 MT D+E D−E
= − (8.98)
T 2 D D
M
= E (8.99)
D
Logo, u(t) ≈ M D e(t) para E < D e se D > E o sinal estará saturado. Ou seja,
pela utilização do dither, o relé ideal foi transformado em um ganho linear
com saturação.
Sugere-se investigar o que acontece quando o dither é do tipo senoidal ou
quadrado.
Desde que GF F (s) seja estável, não há impactos na estabilidade da malha de
controle e a ideia é melhorar o desempenho do sistema de controle “anteci-
pando”a informação sobre r(t).
A função de transferência GP F (s) é um pré-filtro (ou filtro condicionador,
filtro pré-compensador ou outras denominações) que pode limitar a taxa de
variação do sinal r(t), eliminar ruı́dos, normalizar as referências, entre outras
possibilidades.
Tendo-se em perspectiva a utilização de arquiteturas de controle em malha
fechada, necessita-se de uma ferramenta que permita avaliar as caracterı́sticas
da função de transferência de malha fechada GM F (s) partir do conhecimento
da função de transferência de malha aberta GM A (s),
GM A (s)
GM F (s) = (8.101)
1 + GM A (s)
Logo, sistemas do tipo 0 apresentam erro de regime não nulo para entrada
degrau, mas que é reduzido à medida que o ganho K é aumentado.
248 Engenharia de controle
De fato, para sistemas do tipo 1, tem-se a resposta degrau com erro de regime
nulo
1 1
e (∞) = lim s (8.108)
s→0 1 + G(s) s
1
= lim (−z
(8.109)
s→0 1 + K 1 )...(−zm )
s(−p1 )...(−pm )
= 0 (8.110)
em que
NC NP NR
GC (s) = ; GP (s) = ; R(s) = (8.120)
DC DP DR
O objetivo é projetar GC de modo que e(t) → 0 à medida que t → ∞.
Imediatamente a partir da figura 8.20 e de 8.120, obtém-se que
1
E(s) = R(s) (8.121)
1 + GP (s)GC (s)
DP (s)DC (s) NR (s)
= (8.122)
DP (s)DC (s) + NP (s)NC (s) DR (s)
Para que e(∞) = 0, a malha fechada deve ser estável (raı́zes de DP (s)DC (s) +
NP (s)NC (s) = 0 no SPE) e DR (s) deve ser um fator de DP (s)DC (s).
Ou seja, deve existir Q(s) de modo que
Nessas condições,
Exemplo
Sejam dados o modelo do processo GP (s) e a referência rampa R(s)
s+2 1
GP (s) = K ; R(s) = (8.128)
(s + 1)(s + 5) s
e assuma que se deseja projetar
NC (s)
GC (s) = (8.129)
DC (s)
que apresente erro de regime nulo.
A condição “DR (s) deve ser um fator de DP (s)DC (s)” é, no caso, “s deve ser
um fator de (s + 1)(s + 5)DC (s)”.
Uma escolha conveniente é, portanto, DC (s) = s.
De fato, com essa escolha,
(s + 1)(s + 5)DC (s) 1
e(∞) = lim s (8.130)
s→0 (s + 1)(s + 5)DC (s) + K(s + 2)NC (s) s
(s + 1)(s + 5) s
= lim (8.131)
s→0 (s + 1)(s + 5)DC (s) + K(s + 2)NC (s)
= 0 (8.132)
seus polos.
Logo, para realizar projeto de controladores, é interessante dispor de uma
ferramenta que permita visualizar os polos de GM F (s) (malha fechada), a
partir do conhecimento dos polos de GM A (s) (malha aberta)
GM A (s)
GM F (s) = (8.133)
1 + GM A (s)
Uma ferramenta que possibilita tal facilidade é o lugar geométrico das raı́zes
(LGR ou, em inglês, root locus).
O traçado dos vários ramos do gráfico do LGR pode ser feito seguindo alguns
passos simples.
Embora o LGR possa ser traçado em função de diversos parâmetros, nesse
texto foca-se apenas o caso da variação do ganho K ∈ [0, ∞) de GM A = KG(s)
N (s)
GM A (s) = K (8.134)
D(s)
sm + b1 sm−1 + · · · + bm−1 s + bm
= K n (8.135)
s + a1 sn−1 + · · · + an−1 s + an
(s − z1 ) · · · s − zj · · · (s − zm )
= K (8.136)
(s − p1 ) · · · (s − pi ) · · · (s − pn )
Os passos para a confecção do LGR são:
Passo 1: Marcar, no plano s, os polos (pi ) com × e os zeros (zj ) com ◦.
Passo 2: Marcar o trecho do LGR contido no eixo real. Para K positivo,
corresponde aos trechos com número ı́mpar de polos+zeros à direita.
Passo 3: Desenhar as assı́ntotas que:
a) Passam pelo ponto α, dado por
n m
1 X X
α= pi − zi (8.137)
n − m i=1 i=1
d d
∆(s) = 2(s − sbp )∆resto (s) + (s − sbp )2 ∆resto (s) (8.141)
ds ds
= 0 se s = sbp (8.142)
d∆
de modo que ds (s) se anula no ponto de quebra sbp .
O resultado segue notando que o LGR só faz sentido se D(sbp ) ̸= 0 e
N (s)
∆(s) = 1 + (8.143)
D(s)
" #
d∆ 1 N (s) D(s)
= D(s) − N (s) (8.144)
ds D(s)2 ds ds
Exemplo
Considere a função de transferência de malha aberta, a ser operado em malha
fechada com realimentação unitária negativa
s2 + 8s + 25
G(s) = K (8.145)
s5 + 10s4 + 35s3 + 50s2 + 24s
A figura 8.21 ilustra a aplicação dos passos para a construção do LGR em
função do ganho K para o processo descrito pela função de transferência em
8.145
Passo 1: Os zeros são as raı́zes de s2 + 8s + 25 = 0, que são −4 ± j3, e os polos
são as raı́zes de s5 + 10s4 + 35s3 + 50s2 + 24s = 0, que são { 0, −1, −2, −3, −4 }.
Métodos no domı́nio transformado 253
den(s) = s2 + 2s + 16 + 5s + 5a (8.153)
2
= s + 7s + 16 + 5a (8.154)
Exemplo de ajuste de KP
s+3
GP (s) = KP (8.158)
s(s + 1)(s + 2)(s + 4)
de modo que o sobressinal seja MP = 16.3 % (ou seja, ξ = 0.5 ou cos(β) = 60o ).
Método gráfico
1 = |G(a)| (8.159)
a+3
1 = KP (8.160)
a(a + 1)(a + 2)(a + 4)
|a| |a + 1| |a + 2| |a + 4|
KP = (8.161)
|a + 3|
sendo que os diversos módulos (|a|, |a + 1|, |a + 2|, |a + 4|, |a + 3|) podem ser
medidos com o auxı́lio de uma régua.
Havia, no passado, um instrumento próprio para o traçado de LGR, chamado
de Spirule
Figura 8.24: Instrumento Spirule para traçado gráfico de LGR. Imagem obtida
de “History of Computing”, https://www.nzeldes.com/HOC/Spirule.htm.
Método algébrico
Como o modelo do exemplo é de 4a ordem, a aproximação por polos dominan-
tes requer que os dois polos não dominantes (p1 e p2 ) estejam suficientemente
afastados.
Essa condição deverá ser verificada a posteriori.
O denominador-alvo desejado para a função de transferência de malha fechada
é da forma
7 = ωn − p1 − p2 (8.166)
14 = ωn2 − (p1 + p2 )ωn + p1 p2 (8.167)
8 + KP = ωn p1 p2 − ωn2 (p1 + p2 ) (8.168)
3KP = ωn2 p1 p2 (8.169)
cuja solução é
KP = 1.496 (8.170)
ωn = 0.703 (8.171)
p1 = 4.062 (8.172)
p2 = 2.235 (8.173)
Como ξωn << pi o método dos polos dominantes fornece uma solução satis-
fatória.
s+3
Gnovo (s) = KP (λ s + 1) (8.175)
s(s + 1)(s + 2)(s + 4)
Método gráfico
Pelo método gráfico, conforme a figura 8.25, uma solução é KP = 2.7 e λ = 0.4.
Métodos no domı́nio transformado 259
Método algébrico
Considerando as especificações ξ = 0.5 e ωn = 1, o denominador-alvo é
7 = 1 − p1 − p2 (8.182)
KP λ + 14 = p1 p2 − p2 − p1 + 1 (8.183)
KP (3λ + 1) + 8) = p1 p2 − p2 − p1 (8.184)
3KP = p1 p2 (8.185)
cuja solução é
KP = 2.714 (8.186)
λ = 0.421 → corresponde a zero em 2.37 (8.187)
p1 = −3.926 (8.188)
p2 = −2.074 (8.189)
O lugar geométrico das raı́zes é uma ferramenta muito útil que permite
visualizar as dificuldades potenciais no projeto de controladores, bem como
para sugerir propostas de possı́veis estruturas para o controlador. Além
disso, permite a imediata verificação da existência de zeros em localizações
inconvenientes ou o grau de dominância de um par de polos complexos.
ou Z t !
1 de
u(t) = kP e(t) + e(τ )dτ + TD (t) (8.191)
TI 0 dt
em que KP , KI e KD são os ganhos proporcional, integral e derivativo, res-
pectivamente. O TI é o tempo integral (ou 1/TI o número de repetição por
segundo) e TD é o tempo derivativo.
Por vezes, limita-se o ganho segundo
umax ; kP e > umax
u(t) = kP e ; umin ≤ kp e ≤ um ax (8.192)
umin
; kP e < umax
Controlador I-PD
kP G(s)
Y TI s
= (8.198)
R 1 + kp 1 + T1I s + TD s G(s)
1 kp 1 + T1I s + TD s G(s)
= (8.199)
1 + TI s + TI TD s2 1 + kp 1 + 1 + TD s G(s)
TI s
Y (s)
GP (s) = (8.200)
U (s)
1
= (8.201)
(s + 2)(s + 3)
U (s)
GC (s) = ou (8.202)
E(s)
U (s) = GC (s) R(s) − Y (s) (8.203)
1
= KP + KI + KD s E(s) (8.204)
s
2
KD s + KP s + KI
= (8.205)
s
KD s2 + KP s + KI
≈ (8.206)
s(s + α)
s2 + 9.75s + 22.5)
GC1 (s) = 5.6 (8.207)
s(s + 10)
2
s + 8s + 18
GC2 (s) = 7 (8.208)
s(s + 10)
sendo que GC1 aloca os zeros em −6 e −3.75, enquanto GC2 aloca os zeros
complexos conjugados em −4 ± j1.4.
264 Engenharia de controle
Controlador KP KI KD
T
P L
PI 0.9 TL L
0.3
P ID 1.2 TL 2L 0.5L
4M
KC = (8.209)
πAC
Ke−sT
GP (s) = (8.210)
s+a
8.6.3 Anti-windup
O fenômeno de windup é um potencial problema encontrado na prática, ao se
utilizar um integrador na malha de controle para eliminar o erro em regime
permanente.
Se o sinal de erro não for anulado por longo perı́odo, a sua integral assume
valores muito elevados que tendem a saturar o atuador. Na figura 8.32 é visto
um método para combate ao windup que consiste em calcular a diferença entre
o valor do sinal solicitado V (s) e o valor de saturação de U (s) e adicioná-la na
entrada do integrador.
Exemplo
Considere um sistema em que a curva de reação apresenta K = 1, T=1 e
L = 0.5, conforme a notação apresentada na figura 8.31.
Nesse caso, conforme a tabela 8.6.2, o controlador PI é da forma
1
U (s) = (KP + KI )E(s) (8.214)
s
T 1 L
= (0.9 + )E(s) (8.215)
L s 0.3
1.80s + 1.67
≃ (8.216)
s
Se for utilizado o método do limiar de oscilação, o sistema apresenta, conforme
a notação utilizada na figura 8.31, PC = 1.70 e KC = 3.84.
O controlador PI, segundo a tabela 8.6.2, é dado por
1
U (s) = KP + KI E(s) (8.217)
s
!
1 PC
= 0.45KC + E(s) (8.218)
s 1.2
1.73s + 1.42
≃ (8.219)
s
268 Engenharia de controle
T 1
U (s) = 1+ E(s) (8.220)
K (λ + L) Ts
0.4s + 0.4
≃ (8.221)
s
As respostas degrau em malha fechada utilizando os controladores 8.216,
8.219 e 8.221 estão apresentadas na figura 8.33.
e−αs ≃ 1 − αs (8.225)
1 1
e−βs = βs = (8.226)
e 1 + βs
ou
Exemplo
Considere o sistema descrito pela função de transferência
(−0.1s + 1)
G0 (s) = K (8.233)
(5s + 1) (3s + 1) (0.5s + 1)
Pelo método representado pela expressão 8.232,
1
G1 (s) ≃ K e−0.1s e−3s e−0.5s (8.234)
5s + 1
1
= K e−3.6s (8.235)
5s + 1
Pelo método da metade, as constantes de tempo são 5 > 3 > 0.5. A maior
constante de tempo a ser mantida é 5. A maior constante de tempo a ser
desprezada é 3. Logo, a metade, 1.5 = 3/2, é adicionada ao atraso puro, ou
seja, e−2.5s , e a outra metade é acrescentada ao maior constante de tempo 5,
resultando 5 + 1.5 = 6.5.
O termo (−0.1s + 1) é substituı́do por e−0.1s e o termo 0.5s+1 1
por e−0.5s .
Juntando todos os elementos, tem-se a aproximação
1
G2 (s) ≃ K e−1.5s e−0.1s e−0.5s (8.236)
6.5s + 1
1
= K e−2.1s (8.237)
6.5s + 1
A figura 8.34 apresenta as respostas degrau das funções de transferência G0 ,
G1 e G2 .
ẋ = f (x, u) (8.238)
ou " # " #
˙ = 0 1 0
∆x ∆x + ∆u (8.245)
−k1 − 3k2 (x1 )2E −b 1
| {z } | {z }
A B
Admitindo que será usada uma lei de controle do tipo realimentação de estados,
∆u = −K∆x + ∆r (8.246)
a dinâmica em malha fechada para pequenos sinais é dada pelos autovalores
de
" # " #
0 1 0 h i
A − BK = − K1 K2 (8.247)
−k1 − 3k2 (x1 )2 −b 1
" #
0 1
= 2 (8.248)
−k1 − 3k2 (x1 ) − K1 −b − K2
b + K2 = 2.41 (8.252)
2
k1 + 3k2 (x1 ) + K1 = 4.81 (8.253)
(x1 )E uE K1 K2
0 0.00 4.81 1.41
0.5 0.75 3.31 1.41
1 3.00 −1.19 1.41
274 Engenharia de controle
Exemplo
Como um exemplo prático, considere o processo de aquecimento contı́nuo de
lı́quido, conforme esquematizado na figura 8.37, em que o fluxo de vapor v
na serpentina pode ser tomado como a variável intermediária para efeito de
controle cascata.
1
GP 1 (s) = (8.254)
s2+ 3s + 2
1
GP 2 (s) = (8.255)
s+5
276 Engenharia de controle
Y (s)
T (s) = (8.257)
R(s)
GC (s)GP (s)
= (8.258)
1 + GC (s)GP (s)
KP s + KI
= (8.259)
s4 + 8s3 + 17s2 + (10 + KP ) s + KI
1 + p1 + p2 = 8 (8.263)
1 + p1 + p2 + p1 p2 = 17 (8.264)
p1 + p2 + p1 p2 = 10 + KP (8.265)
p1 p2 = K I (8.266)
6.2s + 64
Tint (s) = (8.272)
s2 + 11.2s + 4
Tendo-se o controlador GC2 da malha interna, pode-se projetar o controlador
GC1 da malha externa.
Como GC1 escolheu-se novamente um controlador PI, 8.256 e foram mantidas
as especificações de desempenho de sobressinal de 16.3% e tempo de subida
de 2.4s.
A função de transferência da malha externa é dada por
Y (s)
Text (s) = (8.273)
R(s)
GC1 Tint GP 1
= (8.274)
1 + GC1 Tint GP 1
6.2KP s2 + (64KP + 6.2KI ) s + 64KI
= (8.275)
s5 + 14.2s4 + 99.6s3 + coef2 s2 + coef1 s + 64KI
em que
coef2 = 6.2KP + 214.4 (8.276)
coef1 = 64KP + 6.2KI + 128 (8.277)
Uma solução que atende as especificações estabelecidas, obtida com o auxı́lio
de um computador digital, é KP = 0.98 e KI = 1.8.
A figura 8.38 apresenta o efeito da utilização de estrutura cascata em que se
observa a sua superioridade em relação à rejeição de uma perturbação em v.
278 Engenharia de controle
e o seu valor é
1−α
−1
ϕmax = sin (8.282)
1+α
Se for adequado aproximar o comportamento do sistema em estudo como sendo
de segunda ordem, em torno das frequências de interesse, as especificações de
desempenho requerem apenas o valor do sobressinal desejado (MP ) e do tempo
de resposta, que tipicamente é o de subida (tr ) ou o de acomodação (ts ).
Para modelos de segunda ordem (polos dominantes) e lembrando que tanto o
sobressinal MP quanto a margem de fase γ dependem apenas do coeficiente de
amortecimento ξ, basta ajustar o parâmetro α do compensador de modo que,
na frequência de cruzamento de interesse (aproximadamente ωn que resulta no
tr ou ts desejado), tenha-se ϕmax .
s+2
G(s) = 20 (8.286)
s + 5.6
que resulta em um sobressinal significativamente maior.
Uma recomendação crucial é, portanto, que se verifique se o projeto foi ade-
quado, quer seja por simulação, teste com hardware in the loop ou no próprio
processo.
Tal necessidade é devido ao fato de que foram alocados os polos nos locais
desejados, mas o efeito do zero não foi considerado. Como o zero não está
suficientemente afastado, o seu efeito é significativo.
Ts + 1
GC (s) = K (8.287)
αT s + 1
Y (s)
GP (s) = (8.288)
U (s)
1
= (8.289)
s+1
2. MP = 16.3% (sobressinal)
3. tr = 1s (tempo de subida)
4. Kv = 10
284 Engenharia de controle
1. MP = 20% ⇒ ξ = 0.5
π−cos−1 (ξ)
2. ωn = √ = 2.42rad/s
tr 1−ξ 2
Portanto, os
p polos de malha fechada devem estar localizados em sdesejado =
−ξωn ± ωn 1 − ξ 2 , ou seja, −1.21 ± j2.09.
Um método é utilizar o LGR, conforme ilustrado na figura 8.43, em que se
Para se ter uma margem de folga, escolhe-se 29o + 5o = 34o para ϕmax , que
leva a α = 0.28, T = 0.78, ou seja,
0.78s + 1
G2/3 = 3.3 (8.292)
0.21s + 1
s + 1.3
= 12.2 (8.293)
s + 4.7
Como mencionado anteriormente, em vista da utilização de métodos que en-
volvem heurı́stica, é necessário que seja feita pelo menos uma avaliação do
projeto através de uma simulação ou, preferencialmente, investir em uma va-
lidação junto ao processo fı́sico propriamente dito.
Passo 3 Ajuste do Kv usando compensador lag. A constante de velocidade
Kv , até esta etapa (processo+integrador+lead G2/2 ), é dada por
ou seja,
h i
U (s) = GX (s) R(s) − Y (s) − (1 − e−T s )G(s)U (s) (8.305)
GX (s)
= [R(s) − Y (s)] (8.306)
1 + GX (s)(1 − e−T s )G(s)
GX (s)
= [R(s) − Y (s)] (8.307)
1 + GX (s)G(s) − GX (s)e−T s G(s)
| {z }
GP
GX (s)
= [R(s) − Y (s)] (8.308)
1 + GX (s)G(s) − GX (s)GP (s)
O controlador baseado no preditor de Smith possui, portanto, a forma
GX (s)
GC (s) = (8.309)
1 + GX (s)G(s) − GX (s)GP (s)
em que GX foi projetado desconsiderando o atraso e−T s .
288 Engenharia de controle
d3 y d2 y dy
3
+ a 1 2
+ a2 + a3 y = u (8.310)
dt dt dt
mas gráficos no plano permitem manipular apenas dois.
Assim, fazendo-se a transformação
τ
t= √
3 a
(8.311)
3
tem-se que
q
d3 y q 2
2d y + a √ dy
3
a33 3
+ a1
3
a3 2 2 a3
3
+ a3 y = u (8.312)
dτ dτ dτ
d3 y a1 d2 y a2 dy 1
3
+ √ 2
+q +y = u (8.313)
dτ 3 a3 dτ 3
a2 dτ a3
| {z } 3
β1
| {z }
β2
d3 y d2 y dy
3
+ β 1 2
+ β2 + 1y = v (8.316)
dt dt dt
290 Engenharia de controle
K(s + a)
GM F = K (8.319)
s3 + (2 + b)s2 + (2b + K)s + Ka
seja idêntico a 8.318. Deve-se, a posteriori, verificar se a influência do zero
torna o projeto inadequado.
Resolvendo-se o sistema de equações
2 + b = 19.3 (8.320)
2b + K = 40.5 (8.321)
Ka = 91.1 (8.322)
KD s2 + KP s + KI 1
GM A = (8.323)
s(s + 20) s+1
em que o termo s + 20 é introduzido para tornar o controlador realizável.
Manipulações simples permitem obter o denominador da função de transferên-
cia de malha fechada
21 + KD = 19.4 (8.325)
20 + KP = 40.5 (8.326)
KI = 91.1 (8.327)
Ts + 1
GLead = K (8.328)
αT s + 1
sujeito à restrição 0 < α < 1.
O problema genérico de otimização no Rn consiste em obter um ponto w∗ ∈
Rn que minimiza uma função J : Rn → R, enquanto satisfaz restrições de
igualdade caracterizadas por hi : Rn → R e de desigualdade gj : Rn → R,
i = 1, ..., mI e j = 1, ..., mD :
minn J(w) (8.329)
w∈R
sujeito a
hi (w) = 0 (8.330)
gj (w) ≤ 0 (8.331)
O critério ITAE
Para o critério de otimização ITAE, e assumindo o termo livre do denominador
ωnk , a função de transferência alvo de malha fechada é da forma
wnk
T (s) = (8.341)
Pk (s)
e, para k = 2, 3 e 4, os valores ótimos já calculados para os coeficientes são
Exemplo
Considere um processo descrito pela função de transferência
1
G(s) = K (8.345)
s(s + 1)(s + 2)
a ser controlado em malha fechada por uma realimentação tacométrica M (s) =
1 + λ s. A função de transferência de malha fechada é
G(s)
T (s) = (8.346)
1 + G(s)M (s)
K
= 3 2
(8.347)
s + 3s + (2 + K λ)s + K
294 Engenharia de controle
3 = 1.75 ωn (8.348)
2 + K λ = 2.15 (8.349)
3
K=ω (8.350)
Casamento de modelos
Uma forma interessante de ajustar controladores é construir modelos de refe-
rência (por exemplo, de segunda ordem com ξ e ωn desejados) e utilizar um
algoritmo de otimização para ajustar os parâmetros do controlador minimi-
zando o custo de descasamento J = 0∞ |e(t)| dt.
R
Caso e(t) convirja para 0 no esquema ilustrado na figura 8.48, ter-se-á obtido
sucesso em casar o modelo de referência através da combinação do controlador
e do processo.
J θ∗ = minn J (θ)
θ∈R
g1 θ1 , θ2 , . . . , θq ≤ 0 (8.355)
g2 θ1 ; θ2 , . . . , θq ≤ 0 (8.356)
..
.
gp θ1 , θ1 , . . . , θq ≤ 0 (8.357)
θk+1 = θk+1 + hk
Y (s) GC GP GF F GP
= + (8.358)
R(s) 1 + GC GP 1 + GC GP
GC GP + GF F GP
= (8.359)
1 + GC GP
Y (s) G C G P + GF F GP
= (8.360)
R(s) 1 + GC GP
GC GP + G−1
P GP
= (8.361)
1 + GC GP
GC GP + 1
= (8.362)
1 + GC GP
= 1 (8.363)
Métodos no domı́nio transformado 299
GF F (s) = G−1
P (s)Gaux (s) (8.364)
Exemplo
Seja o processo modelado pela função de transferência
1
GP (s) = (8.366)
s(s + 1)
e o controlador proporcional GC = K.
O valor de K = 1.177 foi ajustado de modo que, sem o compensador GF F , a
resposta degrau apresentasse um sobressinal de 20%.
Escolheu-se α = 10 >> 1 e p = 2, obtendo-se GF F (s),
s(s + 1) 102
GF F (s) = (8.367)
1.177 (s + 10)2
de modo que haja pouca influência em baixas frequências.
A figura 8.53 apresenta a resposta degrau em que se observa, com a presença
do GF F (s), significativa redução do tempo de subida com reduzido sobressinal.
8.11.5 Pré-filtro
Como indica o próprio nome, a função do pré-filtro é reduzir ou realçar com-
ponentes de certas frequências presentes no sinal de referência R(s).
Entre as várias possibilidades para o projeto do filtro estão a atenuação das
altas frequências presentes em variações bruscas de R(s), redução da excitação
de modos ressonantes indesejados e melhoria do desempenho realçando compo-
nentes apropriadas do espectro. Para ilustrar um possı́vel efeito do pré-filtro,
apresenta-se aqui um exemplo numérico.
300 Engenharia de controle
Exemplo
Y (s)
Considere o caso em que relação original GM F (s) = R(s)
s+1
GM F (s) = (8.368)
s2 + 0.75s + 1
s2 + ωn s + (0.9ωn )2
GP F (s) = (8.369)
s2 + 2ωn s + (0.9ωn )2
s2 + s + 0.92
= (8.370)
s2 + 2s + 0.92
8.12 Exercı́cios
8.12.1 Exercı́cio: Efeito da saturação de ganho
Qual o valor de M > 0 a partir da qual ocorre oscilação sustentada? Deter-
minar também a frequência e a amplitude da oscilação, caso ocorra.
0 1 0 0
ẋ = 0 0 1 x + 0 f (y) (8.371)
0 −2 −3 −2
h i
y = 1 0 0 x (8.372)
M se y > 1
f (y) = M y se |y| ≤ 1 (8.373)
−M se y < −1
ẋ1 = x2 (8.374)
ẋ2 = −x1 + sign(x2 − x1 ) (8.375)
em que (
1 se ξ ≥ 0
sign(ξ) = (8.376)
−1 se xi < 0
1.
(s + 1)2
G (s) = (8.382)
s3
2.
1
G (s) = (8.383)
s s2+4
3.
(s + 2)2
G (s) = (8.384)
s s2 + 4
4.
s+1
G (s) = (8.385)
(s − 1) s2 + 4
5.
s+1
G (s) = (8.386)
s (s − 1)
6.
s
G (s) = (8.387)
2s2 − 2s + 3 (s + 3)
7.
(s − 1)2
G (s) = (8.388)
s (s + 1)
Métodos no domı́nio transformado 307
8.
1
G (s) = (8.389)
s (1 + 0.5s) 1 + s + 0.5s2
9.
(s + 1)2
G (s) = (8.390)
s4
10.
K(s + 1)
G(s) = (8.391)
s2 (s + 4)
11.
K(s − 1)
G(s) = (8.392)
s2 + 2s + 2 s2 + 2s + 5
1.
K (s + 4)
G (s) = (8.393)
s (s + 2) (s + 5) s2 + 1.2s + 64.36
2.
K s2 + 4s + 5
G (s) = (8.394)
s2 + 1 (s + 4) (s + 6)
8.12.11 Exercı́cio:
Observe a figura 8.62. Verificar se é possı́vel ajustar o valor de B, de modo
que o os ramos do LGR cruzem o eixo imaginário em ±j3
di
L + Ri = v (8.395)
dt
d2 y i2
m 2 = mg − K (8.396)
dt y
308 Engenharia de controle
1.
s+1
GP (s) = (8.398)
(s + 0.1) (s + 10)
2.
9
GP (s) = (8.399)
s2 + 0.6s + 9
3.
1
GP (s) = (8.400)
s (s + 1)
4.
1
GP (s) = (8.401)
s (s − 1)
5.
10
GP (s) = (8.402)
s2 + s + 1 (s + 10)
6.
10
GP (s) = (8.403)
(s + 1) (s + 10)
310 Engenharia de controle
e
∡G (jωc ) = ψ (8.405)
Assumindo que é fornecido um valor η > 0, obter expressões para a0 , a1 , b0 e
b1 , de modo que o compensador avançador de fase
a1 s + a0
GC (s) = (8.406)
b1 s + b0
seja tal que, em ωc , o sistema compensado apresente a margem de fase (MF)
de η, ou seja,
GC (jωc ) G (jωc ) = 1 (8.407)
e
∡GC (jωc ) G (jωc ) = η − 180o (8.408)
Observação: Uma possı́vel resposta é:
√
α
a0 = (8.409)
M
a0 b1
a1 = (8.410)
α
b0 = 1 (8.411)
√
α
b1 = (8.412)
ωc
em que
1 − sin φ
α = (8.413)
1 + sin φ
φ = η − ψ − 180o (8.414)
9
311
312 Engenharia de controle
ẋ = Ax + Bu (9.2)
y = Cx (9.3)
ou
x (t) = P−1 z (t) (9.5)
representa uma transformação linear.
Notando que
ẋ = P−1 ż (9.6)
tem-se que
A B
z }| { z}|{
−1
ż = PAP z+ PB u (9.9)
C
z }| {
y = CP−1 z (9.10)
é não singular e, portanto, inversı́vel (no caso de sistemas com várias entradas
a matriz U teria mais do que n colunas e o método necessitaria ser estendido).
I = U−1 U (9.14)
.. h i
= . B AB · · · An−1 B (9.15)
p
.. .. ..
= . . ··· . (9.16)
pB pAB · · · pAn−1 B
pB = 0 (9.17)
pAB = 0 (9.18)
..
. (9.19)
n−1
pA B = 1 (9.20)
A = PAP−1 (9.23)
314 Engenharia de controle
Supondo que são fornecidos pelo projetista os polos desejados {λ1 , ..., λn }, a
tarefa agora é obter K tal que o polinômio caracterı́stico de A − BK seja
αn = an + k n (9.38)
..
. (9.39)
α1 = a1 + k 1 (9.40)
Uma vez que K tenha sido encontrada, a versão não transformada pode ser
obtida imediatamente, notando que
O polinômio caracterı́stico de A − BK é
∆ (λ) = λ2 + (3 + k1 ) λ + (2 − k2 ) (9.46)
Portanto, o sistema a ser resolvido é
16 = 2 + k2 (9.47)
4 = 3 + k1 (9.48)
que possui a solução k1 = 1 e k2 = 14.
h i
Sob a lei u = −Kx + v com K = k3 k2 k1 , tem-se a nova matriz de
sistema
0 0 −6 3 h i
A − BK = 1 0 −11 − 1 k3 k2 k1 (9.52)
0 1 −6 0
−3k3 −3k2 −3k1 − 6
= 1 − k3 −k2 −k1 − 11 (9.53)
0 1 −6
∆ (λ) = λ3 + (k2 + 3k3 + 6)λ2 + (k1 + 9k2 + 18k3 + 11)λ + (3k1 + 18k2 + 27k3 + 6)
(9.54)
Igualando-se os coeficientes de ∆(λ) e ∆D (λ), obtém-se o sistema de equações
k2 + 3k3 + 6 = p + 4 (9.55)
k1 + 9k2 + 18k3 + 11 = 4p + 16 (9.56)
3k1 + 18k2 + 27k3 + 6 = 16p (9.57)
k1 − 9k3 = 23 − 5p (9.59)
3k1 − 27k3 = 30 − 2p (9.60)
Se p ̸= 3, não há solução, significando que o polo −3 não pode ser deslocado,
ou seja, o modo associado não é controlável.
Uma hsolução possı́vel
i é p = 3 e k3 = 0, k2 = 1 e k1 = 8, o que fornece
K= 0 1 8 .
318 Engenharia de controle
ẋI = e (9.64)
= r−y (9.65)
= r − CxP (9.66)
resulta que
" #
ẋP
ẋa = (9.69)
ẋI
" #" # " # " #
A 0 xP B 0
= + u+ (r − CxP ) (9.70)
0 0 xI 0 1
" #" # " #
A − BKP −BkI xP 0
= + r (9.71)
−C 0 xI 1
| {z }| {z } | {z }
Aa xa Ba
u = −Kx
b+v (9.72)
ẋ = Ax + Bu ; x(t0 ) = x0 (9.73)
y = Cx (9.74)
ẋ − x
ḃ = A (x − x
b ) − LC (x − x
b) (9.77)
320 Engenharia de controle
e =x−x
x b (9.78)
e − LCx
ė = Ax
x e (9.79)
= (A − LC) x
e (9.80)
x (t) ≃ x
b (t) (9.81)
Notando que
ẋm = ẏ (9.85)
tem-se que
ẏ = Am y + Cxd + Bm u (9.86)
Introduzindo a notação
y = ẏ − Am y − Bm u (9.87)
obtém-se a expressão
y = Cxd (9.88)
Métodos no Domı́nio do Tempo 321
Definindo-se
u = A21 xm + Bd u (9.90)
resulta que
ẋd = Ad xd + u (9.91)
Juntando-se os resultados obtidos, tem-se que
ẋd = Ad xd + u (9.92)
y = Cxd (9.93)
b d + u + L ( y − Cx
ḃ d = Ad x
x bd ) (9.94)
ẋ = Ax + Bu + Fw (9.95)
y = Cx + v (9.96)
b + Bu + L (y − y
ḃ = Ax
x b) (9.99)
b = Cx
y b (9.100)
322 Engenharia de controle
O erro de estimação x
e é dado por
e =x−x
x b (9.101)
Busca-se, agora, a expressão para L(t) que minimiza
P(t) = E[x e (t)T ]
e (t)x (9.102)
que é a covariança do erro de estimação (intuitivamente, o quanto o “estado
estimado” está “disperso” ao redor do “estado real”).
Subtraindo a equação do estado estimado da equação de estado original 9.95,
obtém-se que
ė = (A − LC) x
x e + Fw − Lv (9.103)
Para estudar como varia P com o tempo, determina-se
d
Ṗ = E[x e (t)T ]
e (t)x (9.104)
dt
= AP + PAT − LCP − PCT LT + FQFT + LRLT (9.105)
Note que
(LR − PCT )R−1 (LR − PCT )T = LRLT − LCP − PCT LT + PCT R−1 CP
(9.106)
T −1
mas falta o termo PC R CP na expressão 9.105.
Somando e subtraindo o termo PCT R−1 CP, obtém-se que
Ṗ = AP + PAT + FQFT + LRLT − LCP − PCT LT (9.107)
T T T T −1
= AP + PA + FQF + LRL − PC R CP (9.108)
T −1 T T
+(LR − PC )R (LR − PC ) (9.109)
O termo quadrático (LR − PCT )R−1 (LR − PCT )T tenderia a fazer os ele-
mentos de P (em particular os da diagonal) crescerem, e, portanto, escolhe-se
L que o anula, ou seja,
L = PCT R−1 (9.110)
que é uma expressão semelhante àquela do problema LQR.
Nesse caso, a matriz de covariança do erro de estimação é dada por
Ṗ = AP + PAT + FQFT + LRLT − PCT R−1 CP (9.111)
T
P(0) = E[x(0)x(0) ] (9.112)
que é a equação de Riccati vista anteriormente.
De fato, o problema otimização (LQR) e o de filtragem (Filtro de Kalman)
são duais em um certo sentido, mas cuja análise foge ao escopo deste texto.
Métodos no Domı́nio do Tempo 323
Exemplo de aplicação
Considere o processo modelado pela função de transferência
1
G(s) =
s2 +s+1
324 Engenharia de controle
5 0.05
Assuma que as entradas são U (s) = s (degrau) e D(s) = s2 +0.052
(sinal
senoidal).
Escolhendo-se
1
Q(s) =
(s + 1)2
obtém-se a resposta vista na figura 9.4, em que a perturbação é significativa-
mente atenuada.
e [k] = x[k] − x
O erro de estimação é definido por x b [k].
Métodos no Domı́nio do Tempo 325
e [k + 1] = (A − LC) x
x e [k] (9.117)
b [k|i] = E[x[k] | Yi ]
x (9.120)
e [k | i] = x[k] − x
x b [k | i] (9.121)
T
e [k | i] x
P[k|i] = E[x e [k | i] ] (9.122)
ou
b [k|k − 1] = Ax
x b [k − 1|k − 1]
326 Engenharia de controle
b [k|k − 1] + L y[k] − Cx
b [k|k] = x
x b [k|k − 1]
| {z }
z
e [k, k] = x[k] − x
x b [k, k] (9.125)
= x[k] − x
b [k|k − 1] − L y[k] − Cx
b [k|k − 1] (9.126)
= x[k] − x
b [k|k − 1] − L Cx[k] + v[k] − Cx
b [k|k − 1] (9.127)
= (I − LC) x[k] − x
b [k|k − 1] − Lv[k] (9.128)
= (I − LC) x
e [k|k − 1] − Lv[k] (9.129)
P[k|k] = E[x
e [k|k] x
e [k|k]]
= (I − LC) E[x e [k|k − 1]] (I − LC)T + LRLT
e [k|k − 1] x
= (I − LC) P[k|k − 1] (I − LC)T + LRLT (9.130)
T T
= P[k|k − 1] − LCP[k|k − 1] − P[k|k − 1]C L +
+L CP[k|k − 1]CT + R LT
Nessas condições,
b [k|k − 1] = Ax
x b [k − 1|k − 1] (9.138)
T T
P[k|k − 1] = AP[k − 1|k − 1]A + FQF (9.139)
−1
L = P[k|k − 1]CT CP[k|k − 1]CT + R (9.140)
Fase de atualização: Tendo-se realizado uma nova medida y[k], faz-se a atua-
lização
x[k|k] = x[k|k − 1] + L y[k] − Cx[k|k − 1] (9.141)
P[k|k] = (I − LC) P[k|k − 1] (9.142)
Exemplo
Considere o modelo discretizado dado por
" # " # " #
0.9951 0.0485 0.0049 0.01023 h i
A= B= F= C= 1 0
−0.1938 0.9370 0.1938 0.00871
(9.143)
ẋ = Ax + Bu (9.144)
ẋ = Ax + Bu ; x(t0 ) = x0 (9.147)
330 Engenharia de controle
Doravante, por abuso de notação, J[u (.) , x (.)] será referido como J[u] e o
controle otimizante será denotado u∗ , ou seja, J[u∗ ] = minJ[u].
u
O problema LQR proposto será resolvido utilizando o método da programação
dinâmica, proposto por (BELLMAN, 1957), embora existam outras alternati-
vas.
Aplicando-se o princı́pio da otimalidade de Belman, conforme detalhado no
Apêndice A, a lei de controle ótimo deve satisfazer a equação de Hamilton-
Jacobi-Bellman, dada por
1
T T
−Vt (t, x) = min x Qx + u Ru + VxT (t, x) [Ax + Bu] (9.148)
u 2
1 T
V (tf , x) = x Sx (9.149)
2
em que V (t, x) é a solução desta equação diferencial parcial.
O valor V (0, x0 ) é o custo ótimo a ser atingido por u∗ (t).
Inspirado na condição terminal 9.149, assume-se a mesma forma de expressão
para um t genérico V (t, x) e verifica-se, a posteriori, se a solução obtida satis-
faz, de fato, a equação 9.148.
Assumindo, portanto, que
1
V (t, x) = xT Px (9.150)
2
segue que
VxT = xT P(Ax + Bu)
e, portanto,
∂V ∂V
Vt = + (Ax + Bu) (9.151)
∂t ∂x
1 T
h i 1
= ẋ Px + xT Pẋ + xT Ṗx − xT P(Ax + Bu) (9.152)
2 2
Substituindo-se Vx e Vt na equação de Hamilton-Jacobi-Bellman, tem-se que
1h T i 1
0= ẋ Px + xT Pẋ + xT Ṗx − xT PAx − xT PBu + (9.153)
2 2
1 T
T T T
min x Qx + u Ru + x PAx + x PBu (9.154)
u 2
Uma condição necessária para o ponto de mı́nimo, sem restrições, é que a
derivada em relação à variável de interesse, da função objetivo, se anule, ou
seja, no caso,
∂ 1 T
x Qx + uT Ru + xT PAx + xT PBu =0 (9.155)
∂u 2 u=u∗
Métodos no Domı́nio do Tempo 331
ou
u∗ = −R−1 BT Px (9.156)
já que R é positivo definida.
Substituindo u∗ em 9.154 e considerando que u∗ é ótimo, obtém-se, após
simplificação, que
h i
xT Ṗ + AT P + PAT − PBR−1 BT P + Q x = 0 (9.157)
Identidade de Kalman
A identidade de Kalman, também chamada de return difference equality, é útil
para apresentar algumas propriedades importantes do controlador LQR.
Considere um processo SISO-LTI descrito por
ẋ = Ax + Bu (9.165)
y = Cx (9.166)
Nessas condições, pode-se mostrar (vide, por exemplo, (CRUZ, 1996)) que
∗
1 + GL (s) = ρ + GP (s)∗ GP (s)
ρ 1 + GL (s) (9.173)
1 + GL (jω)2
1 2
= 1+ GP (jω) (9.174)
ρ
≥ 1 (9.175)
A expressão
em 9.175 significa
que o vetor
diferença GL (jω) − (−1) (distância entre
GL (jω) e o ponto crı́tico −1) possui módulo
maior ou igual a 1, conforme visualizado gra-
ficamente na figura 9.7.
Portanto, o ganho de GL (s) pode variar de
0.5 a ∞, sem que a curva de Nyquist enlace
o ponto crı́tico (−1).
O atraso de fase pode ser de até 60o , como Figura 9.7: Justificativa para
ilustrado na figura 9.7. a margem de ganho [ 12 , ∞) e
o o
Em outras palavras, a lei de controle obtida de fase de (−60 , 60 ) para um
utilizando o método LQR apresenta, no caso projeto LQR.
SISO, uma margem de ganho de [0.5, ∞) e
de fase 600 .
Observação:
Quando se utiliza o estado estimado xb no lugar de x para implementar a lei
de controle (ou seja, u = −Kxb + v), as margem de ganho e de fase originais
do LQR são reduzidas (DOYLE, 1978).
334 Engenharia de controle
u = Kx + v (9.176)
u = −Kx
b+v (9.177)
Para mitigar esta situação, pode-se utilizar o método LTR (ou LQG/LTR,
loop transfer recovery), que consiste em projetar, inicialmente, uma função
de transferência alvo baseado no regulador LQR ou no filtro de Kalman (que
possuem as boas propriedades de robustez) e, posteriormente, recuperar as
margens de ganho e de fase, quando se utiliza a lei de controle com o estado
observado, como em 9.177.
A utilização do método LTR pode estar limitada por algun fatores, tais como:
ẋ = Ax + Bu (9.178)
y = Cx (9.179)
u = −Kx (9.181)
K = ρ−1 BT P (9.183)
Por outro lado, uma vez que o estado x não é diretamente disponı́vel, deve-se
estimá-lo a partir de y e u.
Se L é o ganho do observador de estados (ou o filtro de Kalman) obtido
utilizando-se a equação de Riccati, (KALMAN; FALB; ARBIB, 1969)), a es-
timativa x
b é dada por
b + Bu + L(y − yb)
ḃ = Ax
x (9.185)
yb = Cx
b (9.186)
u = −Kx
b (9.187)
b − BKx
ḃ = Ax
x b − LCx
b + Ly (9.188)
u = −Kx
b (9.189)
ẋ = Ax + Bu (9.191)
y = Cx (9.192)
u = −Kx
b+v (9.194)
em que
1. K = −ρ−1 BT P
2. P satisfaz
1
PA + AT P + CT C − PBBT P = 0 (9.195)
ρ
3. x
b é a estimativa obtida pelo observador
b − BKx
ḃ = Ax
x b − LCx
b + Ly (9.196)
tem-se que
−1
lim GC (s) = G−1
P C (sI − A) L (9.197)
ρ↓0+
ẋ = Ax + Bu + Fw (9.198)
y = Cx + v (9.199)
h i h i
em que E w (t) = 0, E w (t) wT (τ ) = Iδ (t − τ ), E v (t) = 0, E v 2 (τ ) =
b + Bu + L (y − yb)
ḃ = Ax
x (9.200)
b = Cx
y b (9.201)
em que
L = µ−1 SCT (9.202)
e S satisfaz a equação algébrica de Riccati
ou seja, GA (jω) não intersecta o cı́rculo de raio unitário com centro em (−1, 0).
Exemplo 1
Considere a LMI
1p2 − 1p1 > 0 (9.214)
que leva a
λ = p2 − p1 (9.216)
Portanto,
λ > 0 ⇐⇒ p2 > p1 (9.217)
Exemplo 2
Considere a LMI
" # " # " #
1 0 0 1 0 0
+ p1 + p2 > 0 (9.218)
0 0 1 0 0 1
" #
1 p1
> 0 (9.219)
p1 p2
que leva a
0 = λ2 − (1 + p2 ) λ + p2 − p21 (9.221)
q
(1 + p2 ) ± (1 + p2 )2 − 4p2 + 4p21
λ =
2
Portanto,
λ > 0 ⇐⇒ p2 > p21 (9.222)
Exemplo 3
Considere a LMI
1 p1 p2
p1 1 0 > 0 (9.223)
p2 0 1
O autovalor é obtido fazendo-se
1 p1 p2
det λI − p 1 0
=0 (9.224)
1
p2 0 1
que leva a
ẋ = Ax (9.231)
em que A ∈ Rn×n .
Seja V (x) da forma
V (x) = xT Px (9.232)
que pode ser considerada função candidata de Lyapunov se P ≻ 0.
Como
d
V x (t) = xT AT P + PA x
(9.233)
dt
a origem (x = 0) será assintoticamente estável se ∃P ∈ Rn×n , PT = P e tal
que
P ≻ 0 (9.234)
T
A P + PA ≺ 0
342 Engenharia de controle
F(P) ≻ 0 (9.236)
ẋ = Ax + Bu (9.237)
ẋ = Ax − Bu (9.238)
= (A − BK)x (9.239)
P ≻ 0 (9.240)
T
(A − BK) P + P(A − BK) ≺ 0 (9.241)
Constata-se, porém, que tanto K como P são incógnitas, de modo que 9.241
não é uma LMI por envolver o produto KT P.
Para contornar o problema, notando que se impõe P ≻ 0 (logo, não singular)
pode-se pré e pós multiplicar a segunda desigualdade por P−1 , obtendo-se
h i
P−1 (A − BK)T P + P(A − BK) P−1 ≺ 0 (9.242)
P−1 AT − P−1 KT BT + AP−1 − BKP−1 ≺ 0
P ≻ 0 (9.243)
T T T
AQ + QA − BM − M B ≺ 0
Métodos no Domı́nio do Tempo 343
K = MQ−1 (9.245)
• X ≻ 0 e Z − YX−1 YT ≻ 0
" #
Z Y
• X≻0e ≻0
YT X
Uma vez que X é inversı́vel, considere a matriz M não singular dada por
" #
I 0
M= (9.246)
WX−1 I
e note que
" # " #" #" #
Z Y I YX−1 Z Y I 0
MT M =
YT X 0 I YT X −X−1 YT I
" #" #
I YX−1 Z − YX−1 YT Y
=
0 I 0 X
" #
Z − YX−1 YT 0
= (9.247)
0 X
sujeito a
F(P) = F0 + p11 F11 + ... + p1m F1m + ... + pn1 F11 + ... + pnm Fnm (9.249)
344 Engenharia de controle
ẋ = Ax ; x(0) = x0 (9.250)
com A estável e Q = QT ≻ 0.
Se P é tal que
P ≻ 0 (9.251)
T
A P + PA + Q ≺ 0
P ≻ 0 (9.254)
T
A P + PA + Q ≺ 0
ẋ = Ax + Bu ; x(0) = x0 (9.257)
AT P + PA − PBR−1 BT P + Q = 0 (9.259)
Métodos no Domı́nio do Tempo 345
sujeito a " #
AT P + PA + Q PB
≻0 (9.263)
BT P R
d
V x (t) = xT AT P + PA x < 0 ; ∀x ̸= 0
(9.266)
dt
o sistema é estável.
346 Engenharia de controle
N
X
= λi xT ATi P + PAi (9.268)
i=1
em vista de 9.265.
Logo, o sistema será estável se for possı́vel obter P = PT ≻ 0 tal que
ou seja,
N
X
(A, B) = λi (Ai , Bi ) (9.271)
i=1
PN
em que λi ≥ 0 e i=1 λi = 1.
Deseja-se obter K, tal que (A, B) é estável sob u = −Kx.
Em outras palavras, os
autovalores de A − BK
devem estar no SPE para
quaisquer (A, B) ∈ co (A1 , B1 ), ..., (AN , BN ) .
Tome-se a função V (x) = xT Px e note que, se for possı́vel obter um único
P = PT ≻ 0 que satisfaz
d
V x (t) = xT (Ai − KBi )T )P + P(Ai − Bi K) x < 0 ; ∀x ̸= 0
dt
(9.272)
para todo i = 1, ..., N , então o sistema é estável.
Em vista da existência de termos tipo PBi K, a expressão entre as parênteses
externas de 9.272 não é uma LMI.
Como feito anteriormente, usa-se o artifı́cio de multiplicar ambos os lados por
P−1 , o que é possı́vel por ter se assumido P ≻ 0, obtendo-se
P−1 (Ai − KBi )T )P + P(Ai − Bi K) P−1 ≺ 0 (9.273)
P−1 ATi − P−1 KT BTi + Ai P−1 − Bi KP−1 ≺ 0 (9.274)
Métodos no Domı́nio do Tempo 347
K = MP (9.276)
−1
= MQ (9.277)
9.13 Exercı́cios
9.13.1 Exercı́cio: Alocação de Polos
Através de realimentação de estados, alocar todos os polos em −1.
0 1 0 0
ẋ = 0 0 1 x + 0 u
−6 −11 −6 1
que minimiza
Z ∞h i
J[x, u] = q 2 xT (t)x(t) + u2 (t) dt (9.280)
0
" # " #
0 −2 1
ẋ = x+ u (9.281)
1 −3 1
h i
y = 0 2 x (9.282)
Deseja-se uma lei de controle da forma u(t) = −Kx b (t)+r(t), em que r(t) é um
sinal de referência e x(t) é uma estimativa de x(t) obtida com um observador
b
com os polos em -20, multiplicidade 2.
h iT
em que u = u1 u2 . Determinar a matriz de ganho K com a estrutura
particular,
" #
1 k1
K= (9.287)
0 k2
de modo que o sistema apresente sob a lei de controle u(t) = Kx(t) + v(t),
um sobressinal de 16.3% e tempo de pico de 3.63 s para v(t) do tipo degrau
unitário.
Y (s) K
G(s) = = (9.291)
U (s) s+1
• Transmissão de dados via sinais digitais, quer seja para ter maior imu-
nidade a ruı́dos ou por razões de segurança via criptografia.
353
354 Engenharia de controle
10.1 Amostrador-segurador
Em geral o sinal contı́nuo é primeiramente amostrado e mantido constante por
um certo tempo (pelo segurador) até que seja completada a conversão A/D.
Nota-se que, quanto menor o tempo em que a chave ∆ fica ligada, menor
é a energia contida no sinal amostrado e∆ .
Necessita-se, assim, de um dispositivo denominado de segurador (ou retentor),
que mantém o valor do sinal amostrado entre os instantes de amostragem.
ou
( (
ẋ = Ac x + Bc e x[k + 1] = Ad x[k] + Bd e[k]
→ (10.2)
u = Cc x u[k] = Cd x[k]
ẋ = Ac x + Bc e (10.3)
u = Cc x (10.4)
ou, usando notação para sequência, x[k + 1] = x([k + 1]T ) e e[k + 1] = e([k +
1]T ), tem-se
A saı́da E(s)
e do segurador pode ser expressa por
1 − e−sT ∗
E(s)
e = E (s) (10.15)
s
1 − e−sT
= L[e∗ (t)] (10.16)
s
Notando que
∞
e∗ (t) =
X
e(kT )δ(t − kT ) (10.17)
k=0
358 Engenharia de controle
U (s) 1 − e−sT
= G(s) (10.23)
E ∗ (s) s
= H(s) (10.24)
U (z) = H(z)E(z)
Exercı́cio:
Obter um modelo discretizado para G(s), supondo que é utilizado um segura-
dor de ordem 0 e o perı́odo de amostragem é T
a
G(s) =
s+a
Então, pela fórmula apresentada
" #
G(s)
G(z) = (1 − z −1 )Z
s
360 Engenharia de controle
ẋ = f (x, u) (10.32)
Y (s) b
ẏ = ay + bu ≡ G(s) = = (10.36)
U (s) s−a
Utilizando-se a aproximação
y (k + 1)T − y(kT )
ẏ ≈
T
para a derivada de y(t) obtém-se que
Z (k+1)T
y (k + 1)T = y(kT ) + [a(τ )y + b(τ )u] dτ (10.37)
kT
= y(kT ) + Ai (10.38)
• Aproximação A3 :
A área A3 = hT é dada por
ay(kT ) + bu(kT ) + ay((k + 1)T ) + b(u(k + 1)T ) T
A3 =
2
e, de modo similar aos casos anteriores,
b
G(z) =
s − a s= 1 z−1
2 z+1
Observações:
1. No domı́nio s, a região de estabilidade é o semiplano esquerdo (SPE),
enquanto no domı́nio Z, é o cı́rculo unitário.
z−1
2. Note que o método “forward Euler ” (s = T ) mapeia alguns s ∈ SPE
para z fora do cı́rculo unitário.
3. Como G(z, T ), é imediato obter a função de transferência quando T é
modificado.
4. O método de Tustin altera a escala de frequências, de modo que é ne-
cessário que se faça a correção mediante pre-warping ((LATHI, 1992),
(FRANKLIN; POWELL; EMAMI-NAEINI, 1986)).
5. Embora não se tenha mostrado a validade do método de substituir s
por z−1 z−1 1 z−1 n
T , zT ou 2 z+1 para casos de x ∈ R , o procedimento pode ser
estendido.
ou
101.8s + 19
GC (s) = − + 20 (10.48)
s2
+ 10.1s + 1
Seja V (s) um termo auxiliar conforme indicado
101.8s + 19
U (s) = − E(s) + 20E(s) (10.49)
|
s2 + 10.1s
{z
+1 }
V (s)
Recomendações:
1. A taxa de amostragem deve ser suficiente grande para que informações
não sejam perdidas.
366 Engenharia de controle
Para e com distribuição uniforme entre [0, ∆], tem-se que a média < e >= ∆/2
e var(e) = ∆2 /2.
Ou seja, o sinal quantizado pode ser considerado como um ruı́do aditivo de
distribuição uniforme de probabilidade, U (∆/2, ∆2 /2).
Método I aprimorado
Note que o sinal amostrado e segurado,
quando filtrado eliminando as altas frequên-
cias, assemelha-se ao sinal original, exceto
por um atraso de T2 .
Portanto, a ideia é utilizar como o modelo do
processo
0.1
Ḡ(s) = e−0.5s
s(s + 0.1)
Com o auxı́lio do MATLAB® , obteve-se o Figura 10.11: Efeito de atraso
controlador projetado no domı́nio de tempo provocado pelo processo de
contı́nuo amostragem
(s + 1.11)(s + 1.25)
D(s) = 409 (10.57)
(s + 10)2
cuja versão discretizada é
(z − 0.986)(z − 4 × 10−4 )
D(z) = 409 (10.58)
(z − 0.45 × 10−4 )2
Método II: Discretizar primeiro o processo e trabalhar no domı́nio z
• Fazer k ← k + 1.
10.8 Exercı́cios
10.8.1 Exercı́cios: Discretização
Obter o modelo de tempo discreto no espaço de estados, assumindo que o
perı́odo de amostragem é Ts = 0.1 s:
" # " #
0 1 0
ẋ = x+ u (10.61)
−2 −3 1
h i
y = 1 0 x (10.62)
8.
e−t
GP (s) =
s2 + 3s + 2
(a) (d)
1 1
GP (s) = (s) =
s+1 s2 + 3s + 2
(b) (e)
s+2 1
G(s) = (s) =
s+1 s2 + 2s + 2
(c) (f)
1 1
G(s) = 2 GP (s) =
s + 2s + 1 s(s + 1
Métodos adicionais
375
11
“He who seeks for methods without having a definite problem in mind
seeks in the most part in vain.”
– David Hilbert
377
378 Engenharia de controle
Ainda mais, se (A, B) é controlável, então ∃P não singular, tal que a trans-
formação similar
z = Pz (11.7)
Alguns Métodos Adicionais 379
z = T (x) (11.22)
de modo que um modelo não linear (de forma muito comum na prática)
·
x= f (x) + g(x)u (11.23)
A ideia é obter T(.) de modo que a expressão 11.26 se torne idêntico àquela
desejada, ou seja, a expressão 11.21, mas com A e B já na forma de Brunovsky
·
z = AB z + BB β −1 (z) u − α (z)
(11.27)
h i
= AB T(x) + BB β −1 T (x) u − α T (x) (11.28)
= AB T (x) + BB βe−1 (x) u − α
e (x) (11.29)
e " #
e−1 0(n−1)×1
BB β (x) = (11.34)
βe−1 (x)
já que AB possui uma forma especial
0 1 0 ··· 0 T2 (x)
0 0 1 ···
0 T1 (x) T3 (x)
.. .. .. . . .. .. ..
AB T (x) = = (11.35)
. . . . .
.
.
0 0 0 ··· 1
Tn (x)
T (x)
n
0 0 0 ··· 0 0
bem como BB ,
0 0
0
0
..
−1 −1
−BB βe (x) = −
0 β (x) = (11.36)
e
.
0
0
1 −βe−1 (x)
Assim, a transformação buscada T deve satisfazer
∂T1
f (x) = T2 (x) (11.37)
∂x
..
.
∂Tn−1
f (x) = Tn (x) (11.38)
∂x
∂Tn
f (x) = −βe−1 (x) αe (x) (11.39)
∂x
e
∂T1
g(x) = 0 (11.40)
∂x
..
.
∂Tn−1
g(x) = 0 (11.41)
∂x
∂Tn
g(x) = β −1 (x) ̸= 0 (11.42)
∂x
Tendo-se obtido T(x), o controle linearizante é u(x) = α
e (x) + βe (x) v, em que
∂Tn
∂x f (x)
e (x) = − ∂T
α (11.43)
n
∂x g(x)
1
βe (x) = ∂Tn
(11.44)
∂x g(x)
382 Engenharia de controle
Em princı́pio, uma vez que o sistema é tornado linear por uma malha interna,
pode-se conceber uma malha externa para alocar arbitrariamente os polos.
Uma dificuldade do enfoque é a necessidade de se dispor de um modelo acu-
rado.
11.1.1 Exemplo
Considere o sistema descrito por
·
x1 = a sin (x2 ) (11.45)
·
x2 = −x21 + u (11.46)
h iT
em que se pode fazer a associação, denotando x = x1 x2 ,
" #
a sin (x2 )
f (x) = (11.47)
−x21
" #
0
g (x) = (11.48)
1
e o controle linearizante é
1
u = x21 + v (11.54)
a cos (x2 )
e
· ·
z 2 = T 2 (x) (11.60)
d
= a sin(x2 ) (11.61)
dt
·
= a cos (x2 ) x2 (11.62)
= a cos (x2 ) −x21 + u (11.63)
!
1
= a cos (x2 ) −x21 + x21 + v (11.64)
a cos (x2 )
= v (11.65)
como desejado.
384 Engenharia de controle
∂T1
f (x) = T2 (x) (11.70)
∂x
..
.
∂Tn−1
f (x) = Tn (x) (11.71)
∂x
∂Tn
f (x) = −βe−1 (x) α
e (x) (11.72)
∂x
∂T1
g(x) = 0 (11.73)
∂x
..
.
∂Tn−1
g(x) = 0 (11.74)
∂x
∂Tn
g(x) = β −1 (x) ̸= 0 (11.75)
∂x
Caso favorável:
Em alguns casos, a própria função h(x) pode ser usada no lugar de T1 (x)
∂T1
T2 (x) = f (x) (11.81)
∂x
= ẏ (11.82)
∂T2
ÿ = ẋ (11.83)
∂x
∂T2 ∂T2
= f (x) + g(x)u (11.84)
∂x ∂x
∂T2
e, se ∂x g(x) = 0, então faz-se
∂T2
T3 (x) = f (x) (11.85)
∂x
= ÿ (11.86)
∂Tn ∂Tn
y (n) = f (x) + g(x)u (11.87)
∂x ∂x
Caso seja satisfeita a condição
∂Tn
g(x) ̸= 0 (11.88)
∂x
o controle linearizante é
" #
1 ∂Tn
u = ∂Tn − f (x) + v (11.89)
∂x g(x)
∂x
y (n) = v (11.90)
ż1 = z2 (11.91)
..
.
żn−1 = zn (11.92)
żn = v (11.93)
386 Engenharia de controle
ẋ1 = x2 (11.94)
ẋ2 = −x1 + ε 1 − x21 x2 + u (11.95)
y = x1 (11.96)
ẏ = ẋ1 = x2 (11.97)
ÿ = ẋ2 = −x1 + ε 1 − x21 x2 + u (11.98)
de modo que
ÿ = −x1 + ε 1 − x21 x2 + u (11.100)
= −x1 + ε 1 − x21 x2 + x1 − ε 1 − x21 x2 + v (11.101)
= v (11.102)
z1 = y ⇒ ż1 = ẏ = z2 (11.103)
z2 = ẏ ⇒ ż2 = ÿ = v (11.104)
Caso geral
Suponha que o modelo é de ordem n (x[t] ∈ Rn ) e assuma que, nas deriva-
ções sucessivas de y, a variável u apareceu na r-ésima derivada ou, em outras
palavras,
∂Tr ∂Tr
y (r) = f (x) + g(x) u (11.105)
∂x |∂x{z }
̸=0
para r < n.
Um modelo
J θ̈ = τ (11.117)
1
L[θ] = L[τ ] (11.118)
Js2
em que J = 1, U (s) = L[τ (t)] é uma lei de controle liga-desliga e Y (s) = L[θ(t)]
é a direção de apontamento do satélite:
d3 y d2 y dy
3
+ a1 2
+ a2 + a3 y = bu + d (11.119)
dt dt dt
em que x = [x1 x2 x3 ]T
Dado um sinal de referência yr (t) suave, deseja-se conceber um sinal de controle
u(t) tal que y(t) −→ yr (t) para t −→ ∞.
Defina o erro e por
e = yr − y (11.121)
390 Engenharia de controle
e = yr − y = yr − x1 (11.122)
ė = ẏr − ẏ = ẏr − x2 (11.123)
ë = ÿr − ÿ = ÿr − x3 (11.124)
s(e) = c1 e + c2 ė + c3 ë (11.125)
T
= c e (11.126)
c3 λ2 + c2 λ + c1 = 0 (11.128)
s(e) = cT e (11.129)
= <c|e> (11.130)
= ∥c∥∥e∥ cos(∡{c, e}) (11.131)
d 2
s (e) = 2s ṡ (11.132)
dt
= 2s < c | ė > (11.133)
d
ṡ(e) = s(e) (11.134)
dt
...
= c1 ė + c2 ë + c3 e (11.135)
...
= c1 (ẏr − x2 ) + c2 (ÿr − x3 ) + c3 ( y r − ẋ3 ) (11.136)
...
= c1 ẏr + c2 ÿr + c3 y r + a3 c3 x1 + (a2 c3 − c1 ) x2 (11.137)
+ (a1 c3 − c2 ) x3 + bc3 u + dc3 (11.138)
...
Note que ṡ(e) depende de {x1 , x2 , x3 , ẏr , ÿr , y}.
Denote uf dbk a parte de u que é uma realimentação de estados, visto em 11.138
x1
uf dbk = − [ a3 c3 a2 c3 − c1 a1 c3 − c2 ] x2 (11.139)
x3
1
ueq = uref + uf dk (11.141)
bc3
Para obter ṡ(e) < 0 quando s(e) > 0 e ṡ(e) > 0 quando s(e) < 0, mesmo na
presença de d não nulo, adiciona-se um termo de suficiente magnitude para
mascará-lo
uslide = −M sign s(e) (11.142)
com M > |d|.
A lei de controle é dada, portanto, por
u = ueq − M sign s(e) (11.143)
Observações
• Fase de atingimento (reaching phase): é aquela em que a evolução do
processo ocorre distante da superfı́cie de deslizamento, mas tentando
atingi-la.
392 Engenharia de controle
Exemplo numérico
Considere o sistema descrito por
...
y + 6ÿ + 11ẏ + 6y = u + d (11.145)
Seja yr (t) = sin(t) e adote a superfı́cie de deslizamento S caracterizado por
s = 1e1 + 2e2 + 1e3 .
A expressão λ2 + 2s + 1 = 0 possui uma raiz dupla em −1.
A perturbação d é assumida ser 1 + 0.2y .
Nessas condições, tem-se que
a = [ 6 11 6 ] (11.146)
c = [1 2 1] (11.147)
O termo de realimentação uf dk é
uf dk = − a3 c3 (a2 c3 − c1 ) (a1 c3 − c2 ) x (11.148)
= −6x1 − 10x2 − 4x3 (11.149)
Nessas condições, desde que se possa conceber um controle ureach que con-
duza o sinal de erro e para uma proximidade adequada de S, o projeto de
controlador deslizante é similar ao apresentado anteriormente.
394 Engenharia de controle
Vantagens e desvantagens
• Vantagens do controle utilizando movimentos deslizantes:
– Redução de ordem do modelo
– Facilidade de ajuste do desempenho
– Robustez a incertezas
• Desvantagens do controle utilizando movimentos deslizantes:
– Consumo de energia (termo M sign s(e) sempre com a amplitude
M, ∀t)
– Desgaste do atuador (chaveamentos bruscos)
– Ressonância e vibração (chaveamento pode ocorrer em frequências
indesejáveis )
– Dificuldade na simulação (chaveamentos de alta frequência dificul-
tam a integração numérica).
ẋ = Ax + Bu (11.154)
ẋm = Am xm + Bm r (11.156)
em que θ1 ∈ R e θ2 é 1 × n.
O casamento perfeito entre o processo controlado e o modelo ocorre se
ẋ = Ax + Bu (11.158)
= Ax + B (θ1 r + θ1 θ2 x) (11.159)
= (A + Bθ1 θ2 ) x + Bθ1 r (11.160)
for idêntico a
ẋm = Am xm + Bm r (11.161)
ou seja, para os valores θ∗1 e θ∗2 dos parâmetros da estrutura de controle,
atinge-se o casamento perfeito se
= Am e + Bm Ψu + Bm Φx (11.173)
Para garantir que e(t) → 0, propõe-se obter as leis de adaptação Ψ e Φ utili-
zando a função candidata de Lyapunov
V (e, Ψ, Φ) = eT Pe + tr{ΨT Ψ} + tr{ΦT Φ} (11.174)
A expressão de V̇ é
V̇ = ėT Pe + eT P ė + 2tr{Φ̇T Φ} + 2tr{Ψ̇T Ψ} (11.175)
= eT ATm + uT ΨT BTm + xT ΦT BTm Pe +
+eT P (Am e + Bm Ψu + +Bm Φy) +
+2tr{Φ̇T Φ} + 2tr{Ψ̇T Ψ} (11.176)
h i
T
= e ATm P T
+ PAm e + 2 e PBm Ψu + tr{Ψ̇ Ψ} T
(11.177)
| {z }
−Q
h i
+ 2 e PBm Φx + tr{Φ̇T Φ}
T
(11.178)
398 Engenharia de controle
Uma vez que, por hipótese, Am possui os seus autovalores no SPE, a equação
ATm P + PAm = −Q com Q ≻ 0 possui uma única solução P ≻ 0, como visto
anteriormente.
Propondo-se a lei de adaptação
e notando que a dimensão do termo eT1×n Pn×n (Bm )n×1 Φ1×n é 1 × n, a pro-
priedade tr{αn×1 β1×n } = βα, permite escrever
tr{Φ̇T Φ} = −tr{(x)n×1 eT PBm Φ } (11.181)
1×n
= eT PBTm Φx (11.182)
Lema de Barbalat
Segundo o lema de Barbalat (mais detalhes no Apêndice F), “dada uma função
f (t) ∈ C 1 [a, ∞) tal que lim f (t) = α, com α < ∞, se f˙(t) for uniformemente
t→∞
contı́nua, então lim f˙(t) = 0”.
t→∞
O lema de Barbalat é muito útil para obter resultados adicionais quando a
função V̇ é apenas semi-definida.
De fato, se a função V̇ (t) é utilizada no lugar da função f (t) do lema de Barba-
lat, então caso V̇ (t) seja uniformemente contı́nua, ter-se-á que lim V̇ (t) = 0.
t→∞
A função V̇ , por sua vez, será uniformemente contı́nua se for possı́vel verificar
que V̈ é limitada, pois uma função f (t) diferenciável e com derivada limitada
(ou seja, f˙ < M para algum M ) é uniformemente contı́nua.
O lema de Barbalat e a verificação da continuidade uniforme de V̇ é tratada
Alguns Métodos Adicionais 399
no Apêndice D.
No presente caso, a derivada temporal de V̇ é dada por
Um modelo de sistema
e
ϕ̇ = f (ϕ, ψ) (11.194)
Notando que
ẋ21 + ẋ22 = cos(x3 )2 + sin(x3 )2 u21 (11.202)
obtém-se que
q
u1 = ẋ21 + ẋ22 (11.203)
q
= ẏ12 + ẏ22 (11.204)
ẋ2 u
sin(x3 ) 1
= (11.205)
ẋ1 u
cos(x3 ) 1
= tan(x3 ) (11.206)
Como u2 = ẋ3 , de
ẋ2
−1
x3 = tan (11.207)
ẋ1
tem-se que
" #
d ẋ2
u2 = tan−1 (11.208)
dt ẋ1
1 ẍ2 ẋ1 − ẍ1 ẋ2
= h i2 (11.209)
1 + ẋ2 ẋ21
ẋ1
Alguns Métodos Adicionais 403
em que
LJ BL + RJ RB + K1 K2
a1 = ; a2 = ; a3 = (11.226)
K2 K2 K2
Portanto, especificando-se um yref (t) desejado, pode-se determinar o sinal de
controle u(t) requerido para que y(t) rastreie yref (t).
necessita-se de ẏref e de ÿ
· d 3tf t2 − 2t3
y ref = ωf (11.231)
dt t3f
tf t − t2
= 6ωf (11.232)
t3f
e
·· d tf t − t2
y ref = 6ωf (11.233)
dt t3f
tf − 2t
= 6ωf (11.234)
t3f
O sistema é plano e o sinal de controle que faz y(t) rastrear y(t)ref é dado por
LJ ·· BL + RJ · RB + K1 K2
uref = y ref + y ref + yref (11.235)
K2 K2 K2
LJ tf − 2t BL + RJ tf t − t2
= 6ωf + 6ω f +
K2 t3f K2 t3f
RB + K1 K2 3tf t2 − 2t3
+ ωf (11.236)
K2 t3f
RB + K1 K2
= −2 ωf t3 +
K2 t3f
RB + K1 K2 BL + RJ
+ 3 −6 ωf t 2
K2 t2f K2 t3f
BL + RJ LJ LJ
+ 6 − 12 ωf t + 6 ωf (11.237)
K2 t2f K2 t3f K2 t2f
e = y − yr (11.239)
= ωr − ω (11.240)
{ u[k + i|k] }i=0,1,2,...,nu = (u[k], u[k + 1], u[k + 2], ..., u[k + nu ]) (11.245)
b [k + 2|k], · · · , x
x b [k + j|k] podem ser obtidos recursivamente
a função custo
ny nu
X 2 X
J[k] = qj yb[k + j|k] − yr + ri u[k + i − 1|k]2 (11.260)
j=1 i=1
Exemplos
• Se (Temp > 150o ) e (Pressão> 3 atm) Então (válvulaA = 40%)
• Se (Temp > 200o ) ou (Pressão> 5 atm) Então (chave1=OFF )
• Se (Temp < 150o ) e (Pressão< 2 atm) Então (alarme=ON )
Figura 11.13: Ilustração das operações intersecção (E) e união (OR) de con-
juntos nebulosos.
Por exemplo, se V é uma tensão e ω é uma rotação, uma regra poderia ser
Inferência nebulosa
Uma forma de inferência nebulosa com estrutura dita de Mamdani encontra-
se ilustrada na figura 11.14 (Mamdani, E. H. Application of fuzzy algorithms
for control of simple dynamic plant. Proc. of the IEE, v. 121, n. 12, p.
1585–1588, 1974).
414 Engenharia de controle
Ao invés de uma apresentação geral, optou-se aqui por ilustrar o processo uti-
lizando um exemplo com apenas três regras, R1, R2 e R3 que permite uma
visualização gráfica simples e objetiva.
O exemplo possui duas entradas e uma saı́da e as regras envolvem os conecti-
vos E e OU .
As entradas são os sinais Temperatura e Pressão e a saı́da é a Abertura da
Válvula. A Temperatura pode ser negativa (NEG), quase nula (0) e positiva
(POS). A Pressão também podem assumir esses valores. A Abertura da Vál-
vula pode ser FECHADA, MÉDIA ou ABERTA.
O valor numérico da Abertura da Válvula (por exemplo, 40% são obtidos como
a abscissa do centroide da área colorida da figura 11.14). Ressalta-se que exis-
Controlador nebuloso
O esquema de inferência nebulosa pode ser utilizado para implementação de
controladores dinâmicos fazendo-se
u[k] = F (u[k − 1], ..., u[k − p], e[k], ...e[k − q]) (11.268)
A figura 11.15 apresenta um caso simples em que u[k] = F (e[k], e[k − 1]).
Alguns Métodos Adicionais 415
À direita da figura 11.15 podem ser vistas as nove regras com conectivo E, ou
seja, por exemplo, se e[k] é Médio (µeM ) E e[k − 1] é Grande (µ(e−1)G ), então
a abertura da válvula u[k] é Média (µuG ).
Para completar a descrição do controlador, deve-se ainda especificar as funções
de pertinência µ.
11.9 Exercı́cios
11.9.1 Exercı́cio: Linearização exata por realimentação de estados
Considere o sistema
ẋ1 = x2 (11.269)
ẋ2 = x2 sin(x1 ) − u cos(x2 ) (11.270)
h iT
em que o estado x = x1 x2 é mensurado por instrumentos precisos.
Obter, se possı́vel, uma lei de controle da forma
obtém-se que
ż1 = z2 (11.273)
ż2 = v (11.274)
1.
2.
3.
" # " #
· sin(x1 ) + x2 0
x = x+ u (11.306)
a x21 1+b
h i
y = 1 0 x (11.307)
em que os coeficientes são desconhecidos, mas tais que |a| ≤ 2 e |b| ≤ 12 . Dada
uma função suave y D , projetar um controlador utilizando modos deslizantes,
de modo que y → y D .
em que o parâmetro a(t) é desconhecido porém limitado a(t) < 1, ∀t ∈ R.
Para o sinal de referência y D (t) = 2 sin(t), obter uma lei de controle u(t) que
y → y D quando t → ∞.
AT P + PA = −I2×2
Φ̇ = F (e, Φ)
ẋ = ax + bu (11.311)
ẋm = am xm + bm r (11.312)
422 Engenharia de controle
u = θ1 x + θ2 r (11.313)
e = x − xm (11.314)
ϕ = θ1 − θ∗1 (11.315)
ψ = θ2 − θ∗2 , (11.316)
ẋ1 = x1 − x1 x2 (11.320)
ẋ2 = x1 x2 − x2 + u (11.321)
x1 = y (11.322)
y = ẏ
x2 = (11.323)
y
ÿ ẏ 2 ẏ
u = − + 2 − + ẏ − y + 1 (11.324)
y y y
Alguns Métodos Adicionais 423
x1 = y (11.328)
ẏ
x2 = +y+f (11.329)
α
ÿ ẏ
x3 = + + ẏ + f + f˙ (11.330)
α ... α
y ÿ ẏ
˙ ¨
u = − + + ÿ + f + f + β +y+f (11.331)
α α α
ẋ1 = x2 (11.332)
mgL k
ẋ2 = − sin(x1 ) − (x1 − x3 ) (11.333)
I I
ẋ3 = x4 (11.334)
k 1
ẋ4 = (x1 − x3 ) + τ (11.335)
J J
Obter a expressão para u(t), adotando-se como o candidato à saı́da plana o
sinal Y (t) = x1 (t).
−1 ≤ u[k] ≤ 1
4. Pão com manteiga é melhor que nada. Nada é melhor do que férias.
Conclui-se, portanto, que Pão com manteiga é melhor que férias.
• A∧B = A e B
• A ∨ B A ou B
• A → B = se A então B
• A ↔ B = A se e somente se B
cujo significado pode ser encontrado na Internet ou livros de lógica elementar.
2. (A → B) ∨ (¬B)
3. ¬ (¬A) → A
4. A ∧ B → B
426 Engenharia de controle
5. A ∧ (¬B) ∨ A
6. ¬(A ∧ B) → A ∨ B
427
12
“Great things are not done by impulse, but by a series of small things
brought together.”
– Vincent Van Gogh
429
430 Engenharia de controle
• Limitações fı́sicas (peso não é problema para um navio, mas sim para
um avião).
• Aprovação do stakeholder.
• Documentação.
• Verificação ̸= validação:
Seleção de sensores
As escolhas dos sensores devem levar em consideração diversas caracterı́sticas
tais como:
• Faixa de operação (faixa de atuação, range): por exemplo, o termo-
par Tipo K (junção Nı́quel-Cromo e Nı́quel-Alumı́nio) possui faixa de
operação entre -200°C e 1200°C. Por outro lado, um termistor (NTC
- Negative Temperature Coefficient) possui, tipicamente, uma faixa de
operação entre -100°C e 300°C.
• Ambiente em que pode ser utilizado. Por exemplo, no vácuo, imerso em
fluido, sob elevada vibração, sob temperaturas muito baixas etc.
• Resolução: é a menor variação da grandeza monitorada que produz uma
variação na medida. Por exemplo, se um conversor análogo digital (A/D)
utiliza 8 bits, para representar o valor de uma grandeza que varia de 0 a
100 unidades, então a menor variação percebida é 100/28 = 0.3906, mas,
se utiliza 12 bits, tem-se a resolução de 100/21 2 = 0.0244
• Precisão e exatidão (acurácia): precisão se refere ao grau de variação de
resultados quando se realizam várias medições de uma mesma grandeza
sob condições iguais, enquanto exatidão indica o quão próximo o valor
medido está próximo ao valor real. Por exemplo, um sensor de desloca-
mento linear (linear variable displacement transducer - LVDT) utilizado
com um circuito muito ruidoso de média zero pode ser acurado na média
de muitas leituras, mas uma leitura única pode estar bastante afastada
do valor real. A exatidão é definida numericamente como o máximo erro
entre o valor verdadeiro e o valor medido. A precisão se relaciona com a
repetibilidade, em que medidas consistentes são obtidas através de múl-
tiplas medições sob condições idênticas de ambiente e em curto espaço
de tempo.
• Sensibilidade: o termopar Tipo K possui sensibilidade de aproximada-
mente 41µV/°C. Porém, se o amplificador for ruidoso e o conversor A/D
utilizar poucos bits, a saı́da pode ter pouca precisão e baixa resolução.
Alguns aspectos relevantes em projetos 437
Seleção de atuadores
Algumas caracterı́sticas de atuadores possuem descrições semelhantes aos dos
sensores e a adaptação é bastante intuitiva, caso em que se limita aqui um
detalhamento mais elaborado. As escolhas dos atuadores devem considerar
caracterı́sticas tais como:
Processador digital
Com os avanços conquistados no campo da tecnologia digital, os sistemas mo-
dernos de aquisição de dados são, frequentemente, baseados em processadores
digitais.
A utilização de processadores digitais pode ser tornada mais segura utilizando
cuidados especı́ficos, tais como
• Uso de watchdog timer (cão de guarda) para reinicializar algoritmos ou
softwares em caso de erros.
testes. Embora seja efetivo, há detalhes como o custo, duração para o
setup, segurança que podem comprometer a viabilidade.
12.12 Documentação
Essa é uma etapa que deve ocorrer em todas as fases do projeto devido a razões
variadas.
12.13 Implementação
A implementação depende, obviamente, do sistema especı́fico em desenvolvi-
mento.
Porém, algumas ponderações são relevantes.
12.14 Entrega
A entrega é uma ocasião especial que, por vezes, demanda uma atenção espe-
cial e pode requerer alguns rituais especı́ficos.
• Em alguns setores, é mandatória a certificação realizada por instituições
especiais e independentes.
• Mais uma vez, lembrar que a operação assistida envolve custos de pes-
soal e de material, principalmente se forem feitos experimentos com o
processo (por exemplo, aplicar um degrau ou injetar ruı́dos).
12.17 Manutenção
• É importante lembrar que tanto garantias quanto contratos de manu-
tenção costumam incorrer em elevação de custos.
12.18 Desativação
Embora essa etapa não seja sempre relevante, por vezes a desativação pode
requerer procedimentos especiais, por exemplo, no caso de envolver materi-
ais radioativos, componentes contaminados por patógenos (bactérias, fungos),
substâncias tóxicas etc.
Detecção de falhas
Para se garantir a segurança ou a continuidade das operações, pode-se valer
também de mecanismos de tolerância a falhas, tipicamente baseadas na exis-
tência de algum tipo de redundância.
A detecção de falha pode ser realizada com base em diferentes enfoques, como
ilustrado com alguns exemplos.
Isolação da falha
Detectando-se uma falha, aciona-se em geral um alarme e um sinal que inicia
alguma forma de mitigação.
É importante notar que um mau funcionamento de algum componente pode
eventualmente disparar vários alarmes distintos relacionados com processos
ligados a essa falha e que podem confundir o operador, ou então o mesmo
alarme ser acionado repetidas vezes se não houver um mecanismo de deboun-
cing.
O passo subsequente é a isolação da falha, ou seja, o reconhecimento de qual
448 Engenharia de controle
Ativação do back up
12.21 Comentários
As etapas para o desenvolvimento de Sistemas de Controle que são menciona-
das neste texto são inspiradas na literatura de Engenharia de Sistemas.
Uma boa fonte de informações sobre Engenharia de Sistemas é o texto aberto
da NASA: National Aeronautics and Space Administration - NASA - Sys-
tems Engineering Handbook, NASA SP-2016-6105, Rev2, NASA Headquar-
ters, Washington, 2016.
A primeira utilização da palavra reliability é atribuı́da ao poeta Samuel T.
Coleridge, 1816. Vide Saleh, J. H. e Marais, K. Highlights from the early (and
450 Engenharia de controle
12.22 Exercı́cios
12.22.1 Exercı́cio: Especificações de requisitos
Conceber potenciais requisitos para o problema de controle envolvidos em
seguintes atividades
1. Iluminação hospitalar
3. Construção de drones
4. Fabricação de brinquedos
1. Manutenção corretiva
2. Manutenção programada
3. Manutenção preditiva
12.22.10 TRIZ
A sigla TRIZ, originada do russo Teoriya Resheniya Izobretatelskikh Zadatch,
pode ser traduzido como Teoria da Resolução Inventiva de Problemas. Buscar
elementos dessa teoria na Internet e comentar sobre o potencial de uso dessa
teoria no desenvolvimento de projeto de sistemas de controle.
Parte VI
Apêndices
453
13
Apêndices
x(t0 ) = x0 (13.2)
x(tf ) = xf (13.3)
h i
Usualmente são adotados para X conjuntos tais como C1 t0 , tf ; Rn , ou
seja, espaço de funções diferenciáveis com a primeira derivada contı́nua.
As grandezas t0 , tf , x0 e xf são assumidas fixas e J : X −→ R é da forma,
Z tf
J[x] = c t, x (t) , ẋ (t) dt (13.4)
t0
455
456 Engenharia de controle
Assuma que existe x∗ (t) é uma solução local (ponto de mı́nimo de J).
J[x∗ ] ≤ J[x∗ + h]
e (13.5)
h i
Seja h uma função C 1 t0 , tf ; Rn , tal que h(t0 ) = 0.
J(ε)
e = J[x∗ + h]
e (13.6)
∗
= J[x + εh] (13.7)
e, portanto,
"Z #
dJ(ε)
e tf
= cx t, x (t) , ẋ (t) h + cẋ t, x (t) , ẋ (t) ḣ dt (13.10)
dε t0
Z tf
= cx t, x (t) , ẋ (t) hdt +
t0
Z tf
+ cẋ t, x (t) , ẋ (t) ḣ(t) dt (13.11)
t0 | {z }| {z }
u dv
e, logo,
Z tf Z tf
u dv = 0 − v du (13.15)
t0 t0
Z tf
d
= − h cẋ dt (13.16)
t0 dt
dJ(ε)
A expressão pode agora ser escrita na forma
e
dε
Z tf Z tf
dJ(ε)
e
= cx hdt + udv (13.17)
dε t0 t0
Z tf " #
d
= cx − cẋ h dt (13.18)
t0 dt
em que os argumentos de cx , cẋ e de h foram omitidos para simplificar a
notação.
Como a perturbação h é escolhida arbitrariamente, deve-se ter
!
d
cẋ − cx =0 (13.19)
dt
x=x∗
Exemplo
Seja o problema de cálculo de variações em que x : R → R e x ∈ C 1
Z π h i
2
J[x] = ẋ2 (t) − x2 (t) dt (13.20)
0
com as restrições
x(0) = 0 (13.21)
π
x = 1 (13.22)
2
Fazendo-se a associação
cx = −2x (13.24)
cẋ = 2ẋ (13.25)
ẍ + x = 0 (13.27)
cuja solução é
x∗ (t) = a + b sin(t) (13.28)
Impondo as condições de contorno,
a + b sin(0) = 0 (13.29)
π
a + b sin( ) = 1 (13.30)
2
obtém-se
e a solução do problema é
x∗ = sin(t) (13.32)
Apêndices 459
ẋ = Ax ; x(0) = x0 (13.33)
dx
e, lembrando que ẋ = dt , pode-se escrever
dx = Ax(t)dt (13.34)
Z t
x(t) = x0 + Ax (τ ) dτ (13.35)
0
A dificuldade para resolver 13.35 está no fato de que x está presente em ambos
os lados da equação.
No método iterativo (iteração de Picard), a ideia é construir uma sequência
de funções usando a recursão
Observações
1. Muitas vezes é utilizada a notação Φ(t1 , t0 ) para representar eA(t1 −t0 ) .
Na literatura, Φ(t1 , t0 ) é denominada matriz de transição de estados,
já que para sistemas ẋ = Ax a solução a partir de x(t0 ) é x(t1 ) =
eA(t1 −t0 ) x(t0 ) = Φ(t1 , t0 )x(t0 ).
é dada por Rt
A(σ)dσ
x(t) = e 0 (13.56)
462 Engenharia de controle
1. utilizando a diagonalização
A = PΛP−1 (13.62)
já que
∆(A)
b = a0 An + a1 An−1 + a2 An−2 + · · · + an−1 A + an I (13.68)
∆(A)
b =0 (13.69)
464 Engenharia de controle
1
(sI − A)−1 = adj (sI − A) (13.70)
det (sI − A)
Lembrando que
a0 I = R0 (13.77)
a1 I = R1 − AR0 (13.78)
a2 I = R2 − AR1 (13.79)
..
.
an−1 I = Rn−1 − ARn−2 (13.80)
an I = −ARn−1 (13.81)
Apêndices 465
R0 = a0 I (13.82)
R1 = a1 I + AR0 (13.83)
R2 = a2 I + AR1 (13.84)
..
.
Rn−1 = an−1 I + ARn−2 (13.85)
an I = −ARn−1 (13.86)
R0 = a0 I (13.87)
R1 = a1 I + a0 A (13.88)
2
R2 = a2 I + a1 A + a0 A (13.89)
..
.
Rn−1 = an−1 I + an−2 A + . . . + a0 An−1 (13.90)
∆(A)
b = a0 An + a1 An−1 + a2 An−2 + · · · + an−1 A + an I = 0 (13.91)
ou seja, qualquer polinômio de matriz pode ser expresso como uma combinação
de potências até grau n − 1
P (A) = α0 I + α1 A + α2 A2 + . . . + αn−1 An−1 (13.94)
sendo que os coeficientes αi ainda devem ser determinados.
Como a expressão satisfeita por P (A) é a mesma que aquela satisfeita por
cada autovalor λi , deve-se ter também que:
P (λ1 ) = α0 + α1 λ1 + α2 λ21 + . . . + αn−1 λn−1
1 (13.95)
P (λ2 ) = α0 + α1 λ2 + α2 λ22 + ... + αn−1 λn−1
2 (13.96)
..
.
P (λn ) = α0 + α1 λn + α2 λ2n + . . . + αn−1 λn−1
n (13.97)
com λi sendo as raı́zes de det(sI − A) = 0 (assumidas distintas).
No caso especial de P (A) = eAt , resolve-se o sistema de equações
eλ1 t = α0 (t) + α1 (t)λ1 + α2 (t)λ21 + . . . + αn−1 (t)λn−1
1 (13.98)
e λ2 t
= α0 (t) + α1 (t)λ2 + α2 (t)λ22 + ... + αn−1 (t)λn−1
2 (13.99)
..
.
eλn t = α0 (t) + α1 (t)λn + α2 (t)λ2n + . . . + αn−1 (t)λnn−1 (13.100)
e obtém-se ( α1 (t), α2 (t), · · · , αn (t) ).
Portanto, a fórmula fechada desejada para eAt é dada por
eAt = α0 (t)I + α1 (t)A + α2 (t)A2 + . . . + αn−1 (t)An−1 (13.101)
Exemplo
Dada a matriz " #
0 1
A= (13.102)
−6 −5
deseja-se obter uma expressão fechada para eAt .
Para utilizar o método baseado no teorema de Cayley-Hamilton, seja
" # " #
At 1 0 0 1
e = α0 + α1 (13.103)
0 1 −6 −5
Os autovalores de A são obtidos de
" # " #
1 0 0 1
det s − = 0 (13.104)
0 1 −6 −5
Apêndices 467
cuja solução é
e, portanto,
" # " #
1 0 0 1
eAt = 3e−2t − 2e−3t + e−2t − e−3t (13.109)
0 1 −6 −5
" # " #
−2t 3 1 −3t −2 −1
= e +e (13.110)
−6 −2 6 3
Como esse exemplo pode ser resolvido também via diagonalização, pois λ1 ̸=
λ2 ., busca-se a matriz de transformação P.
Os autovetores são
" #" # " #
0 1 v1,1 v1,1
= −2 → v1,2 = −2v1,1 (13.111)
−6 −5 v1,2 v1,2
" #" # " #
0 1 v2,1 v2,1
= −3 → v2,2 = −3v2,1 (13.112)
−6 −5 v2,2 v2,2
e, de fato,
" #" #" #
3 1 3 −1 1 1
Λ = (13.116)
−2 −1 +6 8 −2 −3
" #
−2 0
= (13.117)
0 −3
ẋ = eAt x0 (13.122)
n
X
= Mk eλk t x0 (13.123)
k=1
Figura 13.2: Ilustração de como varia a fase de ∆(jω) à medida que ω varia
de 0 → ∞.
Pela figura 13.2, é imediato notar que a fase de ∆(jω) varia de 0 a nπ/2 à
medida que ω varia de 0 → ∞, se todas as raı́zes estiverem no interior do SPE.
Critério de Hermite-Bieler
Sem perda de generalidade, é admitido que n é par, uma vez que, para n
ı́mpar, o resultado pode ser obtido com um método análogo.
Apêndices 471
Dados E(r) e O(r), constrói-se uma tabela incluindo a linha P (r) conforme
E : a0 a2 a4 ··· an−2 an
O : a1 a3 a5 ··· an−1 0 (13.132)
P : b1 b2 b3 ··· b n2
em que
a1 a2 −a0 a3 a1 a4 −a0 a5
b1 = a1 b2 = a1 · · · b n2 = an (13.133)
Será mostrado que E(r) e O(r) formam um par positivo se e somente se O(r)
e P (r) formam um par positivo.
Note, inicialmente, que
a0
P (r) = E(r) − r O(r) (13.134)
a1
pois
a0
E(r) − r O(r) = a0 rm + a2 rm−1 + · · · + an−2 r + an −
a1
a0 m
− a1 r + a3 rm−1 + · · · + an−1 r (13.135)
a
1
a0 a0
= a0 − a1 rm + a2 − a3 rm−1 + · · · +
a1 a1
a0
+ an−2 − an−1 r + an (13.136)
a1
a1 a2 − a0 a3 m−1 a1 a4 − a0 a5 m−1
= s + r + ··· +
a1 a1
| {z } | {z }
b1 b2
a1 an−2 − a0 an−1
+ r + an = P (r) (13.137)
a1 |{z}
| {z } bn
b n −1 2
2
Para verificar a suficiência, assume-se que O(r) e P (r) formam um par positivo
e mostra-se que E(r) e O(r) são pares positivos.
Em vista de
a0
P (r) = E(r) − r O(r) (13.138)
a1
472 Engenharia de controle
b1 = a1 a2 −a0 a3
a1 b2 = a1 a4 −a0 a5
a1 · · · b n2 −1 = a1 an−4a−a
1
0 an−3
b n2 = an
b1 a3 −a1 b2 b1 a5 −a1 b3
c1 = b1 c2 = b1 · · · c n2 −1 = b n2
.. (13.140)
.
t1 = an
Teorema do resı́duo
Se f : C → C é uma função analı́tica em uma região simplesmente conexa
Ω de C, delimitada pela curva fechada Γ exceto por singularidades isoladas
◦
r1 , ..., rq ∈ Ω, então
I h i
f (s) ds = 2πj res (f, r1 ) + · · · + res f, rq (13.141)
Γ
◦
em que Ω denota o interior de Ω, Γ é percorrida no sentido anti-horário e
res (f, ri ) denota o resı́duo de f em ri .
Teorema de Cauchy
Se f : C → C é uma função analı́tica em uma região Ω delimitada pela curva
fechada Γ, então I
f (s) ds = 0 (13.142)
Γ
Fórmula de Lucas
Se p(s) = aq (s − z1 )(s − z2 )...(s − zq ) e p′ (s) é a sua derivada, então
p′ (s) 1 1 1
= + + ··· + (13.143)
p (s) s − z1 s − z2 s − zq
q
X 1
= (13.144)
i=1
s − zi
e, portanto,
p′ (s) ℓ q ′ (s)
= + (13.147)
p (s) s − zi q (s)
Procedendo-se analogamente com o polinômio q (s) e assim sucessivamente até
a última raiz, obtém-se o resultado desejado.
A fórmula de Lucas pode ser estendida para o caso em que p(s) é uma razão
de polinômios.
Considere, inicialmente, um polo s = ri de multiplicidade ℓ ≥ 1 de p(s), ou
seja,
e, portanto,
p′ (s) ℓ q ′ (s)
=− + (13.150)
p (s) s − ri q (s)
Combinando-se os resultados para os zeros e para os polos, tem-se para uma
função f (s) descrita como uma razão de polinômios, com Z zeros e P polos
em uma região Ω que
Z P
f ′ (s) X 1 X 1 g ′ (s)
= − + (13.151)
f (s) i=1
s − zi i=1 s − ri g (s)
◦
em que a função g (s) é analı́tica em Ω.
Princı́pio do argumento
Seja f : C → C uma razão de polinômios, com zi , i = 1, ..., Z zeros e rk , k =
1, ..., P polos em uma região Ω delimitada pela curva fechada Γ. Em vista da
versão estendida da fórmula de Lucas 13.151,
Z P
f ′ (s) X 1 X 1 g ′ (s)
= − + (13.152)
f (s) i=1
s − zi i=1 s − ri g (s)
Apêndices 475
0
z }| {
Z P
f ′ (s) 1 1 g ′ (s)
I I X I X I
ds = ds − ds + ds (13.153)
Γ f (s) Γ i=1
s − zi Γ i=1
s − ri Γ g (s)
em que o último termo é nulo em vista do teorema de Cauchy.
Pelo teorema do resı́duo,
Z Z I
1 1
I X X
ds = ds (13.154)
Γ i=1
s − zi i=1 Γ s − zi
1 1
Z z
X }| { z }| {
= 2πj res (f, z1 ) + · · · + res f, zq (13.155)
i=1
= 2πjZ (13.156)
e, analogamente,
P
1
I X
ds = 2πjP (13.157)
Γ i=1
s − ri
ou seja,
f ′ (s)
I
ds = 2πj [Z − P ] (13.158)
Γ f (s)
A imagem através de f (s) à medida que s percorre uma curva Γ no plano s é
uma outra curva Λ = f (Γ) no plano {Re{f (s)}, Im{G(s)}}.
Utilizando a notação w = f (s), obtém-se que
dw
f ′ (s) 1 z ′ }| {
I I
ds = f (s) ds
Γ f (s) Γ w
1
I
= dw
Λ w
= ln w|Λ
= ln |w| ej∡w
Λ
0 pois Λ fechado
z }| {
= ln |w| Λ + ln ej∡w
w⟲Λ
= j∡w|w⟲Λ
= 2πjN [0, + ⟲] (13.159)
476 Engenharia de controle
N [0, + ⟲] = Z − P (13.160)
A ideia do critério de Nyquist é utilizar este fato para verificar se existem polos
de malha fechada no semiplano direito (SPD), caso em que o sistema não seria
estável.
Critério de Nyquist
Seja Ga (s) uma função de transferência de malha aberta com P polos no SPD
e Γ o contorno de Nyquist, a ser percorrido no sentido anti-horário.
A função de transferência de malha fechada é dada por
Ga (s)
Gf (s) = (13.161)
1 + Ga (s)
e, portanto, os polos de malha fechada são as raı́zes de 1 + Ga (s) = 0.
O critério consiste em verificar se Z = 0, o número de zeros de 1+Ga (s) = 0, a
partir do conhecimento de P (número de polos de malha aberta) e de N [0, ⟲],
o número de enlaçamentos do ponto 0 pela curva Λ = 1 + Ga (Γ).
É conveniente, para efeitos de praticidade, substituir N [0, ⟲] por N [−1, ⟲] e
traçar Λt = Ga (Γ), que é a versão transladada de 1 + Ga (Γ) de 1.
A porção interessante de Λt é aquela que corresponde à faixa de Ga (jω) para
ω = 0 a ω = ∞, ou seja, basta que se trace a versão polar da resposta em
frequência de Ga (s) (as curvas de Bode já fornecem o módulo e a fase de
Ga (jω)).
Apêndices 477
Z = N [−1, + ⟲] + P (13.162)
e, de fato, o sistema será estável se Z = 0, ou seja, nenhum polo de malha
fechada no semiplano direito (mais rigorosamente, no interior do contorno de
Nyquist).
Se o contorno de Nyquist Γ é percorrido no sentido horário, ou seja, de ω = 0
a ω = ∞, os enlaçamentos de −1 devem ser considerados positivos se ocorrem
no sentido horário N [0, + ⟳].
Caso a função de transferência de malha aberta possua polos imaginários puros
ou polo na origem, o contorno deve ser acrescido de desvios infinitesimais, pois
o contorno Γ não deve passar por singularidades.
478 Engenharia de controle
em que J(t, x)[u] é o custo ainda a ser incorrido (cost to go), estando o estado
em x(t) = x no instante t
Ou seja, de modo mais explı́cito,
" Z tf #
J(t, x)[u] ≜ cf x(tf ) + cc x(τ , u(τ ), τ )dτ (13.167)
t x(t)=x
Apêndices 479
Observações
• A equação HJB pode ser expressa em termos do Hamiltoniano:
−Vt (t, x) = min H(x, u, Vx , t) (13.183)
u∈U
para ∀n ∈ N .
Como f˙(t) é assumida ser uniformemente contı́nua, para esse ε, ∃δ > 0 tal que
∀n ∈ N ε
|t − tn | < δ =⇒ f˙(t) − f˙(tn ) ≤ (13.194)
2
e, portanto,
˙ f˙(tn ) − f˙(tn ) − f˙(t)
f (t) = (13.195)
·
˙
f (tn ) − f (tn ) − f˙(t)
≥ (13.196)
ε
≥ ε− (13.197)
2
ε
= (13.198)
2
Como f (t) ∈ C 1 [a, ∞), tem-se que
Z Z
tn +δ Z tn tn +δ
˙
f (t)dt − ˙
f (t)dt =
˙
f (t)dt
a a tn
Z tn +δ
˙
= f (t) dt
tn
Z tn +δ
ε
≥ dt
tn 2
εδ
= >0 (13.199)
2
Por outro lado, Z tn
f˙(t)dt = f (tn ) − f (a) (13.200)
a
que permite escrever
Z
tn +δ Z tn
f˙(t)dt − f˙(t)dt
lim = lim f (tn + δ) − f (tn )
t→∞ a a t→∞
= |α − α|
= 0 (13.201)
enquanto, de 13.201,
Z
tn +δ Z tn
f˙(t)dt − f˙(t)dt = 0 (13.203)
a a
2 π
Z
b1 = M sin (ωt) d (ωt) (13.213)
π 0
2M π
Z
= sin (ωt) d (ωt) (13.214)
π 0
2M π
= − cos (ωt)0 (13.215)
π
4M
= (13.216)
π
Se o processo G(s) atenua as harmônicas superiores, então é plausı́vel, em
muitos casos, utilizar a aproximação u(t) = 4M 4M
π sin(ωt) e o fator πE é deno-
minado de ganho equivalente do relé.
Este procedimento é uma versão do princı́pio de balanceamento de harmônicas
em que se considera apenas a primeira harmônica.
O método é aplicável a outros tipos de não linearidades, tais como amplificador
com saturação, mecanismos com folga de engrenagem, atrito seco, componen-
tes que p
exibe resistência negativa em uma faixa de operação, sensores tipo
u(t) = e(t) e outros, desde que as harmônicas superiores sejam suficiente-
mente atenuadas pelo processo G(s)
Então a não linearidade pode ser aproximada for N (E), conhecida como fun-
ção descritiva, dada por
1
G(s) = (13.218)
s3 + 3s2 + 2s
tem-se que
1
1 + N (E) =0 (13.219)
(jωosc )3 + 3(jωosc )2 + 2(jωosc )
ou
(jωosc )3 + 3 (jωosc )2 + 2 (jωosc ) + N (E) = 0 (13.220)
Apêndices 487
N (E) − 3ω 2 = 0 ; −ω 3 + 2ω = 0 (13.221)
L{∆iL } 1 Ls + R
= (13.227)
L{∆iD } LC s + R
2 1
L s + LC
Considere que os parâmetros do circuito são R = 0.5 Ω , C = 0.2 F e L = 0.5 H
e, com o intuito de simplificar os cálculos e também a apresentação das ideias,
seja a caracterı́stica aproximada do diodo túnel conforme apresentado na figura
13.5c.
Substituindo os valores de R, L e C, bem como os parâmetros que caracterizam
o gráfico da não linearidade, a condição“1+N (E)G(jωosc ) = 0” leva ao sistema
de equações
1 + 5N (E) = 0 (13.228)
2
−ω + 10 + 5N (E) = 0 (13.229)
Por outro lado, a função descritiva da não linearidade com resistência negativa
em uma região, encontrada em vários livros sobre sistemas não lineares, é dada
por
! !v
u !2
M −1 h h u h
N (E) = −1 + π − 2 sin −2 t1 − (13.230)
π E E E
Assim, o valor de E tal que N (E) = −0.2 pode ser obtido do gráfico
Oscilador “duro”
Considere o circuito envolvendo um relé com zona morta, conforme ilustrado
na figura 13.7.
Note que, quando o sinal e(t) é pequeno (no exemplo, |e(t)| ≤ 0.1), o relé se
encontra na região de zona morta e a saı́da correspondente é 0.
Porém, se alguma perturbação externa tornar |e(t)| > 0.1, o circuito apresen-
tará oscilação, como será verificado usando o método da primeira harmônica.
A condição de oscilação é
1
1 + N (E) =0 (13.231)
s3 + 3s2 + 2s
√
que leva à solução ωosc = 2 e N (E) = 6.
A figura 13.8 apresenta graficamente o ganho equivalente do relé com zona
morta.
Nota-se que N (E) = 6 corresponde a 2 valores de E. Porém, apenas E ≈ 0.41
corresponde a uma oscilação sustentada, como pode ser concluı́do por uma
análise qualitativa simples.
Figura 13.8: Ganho equivalente do relé com zona morta e a solução do exemplo.
490 Engenharia de controle
Quando a função não linear apresenta memória, como ocorre com a presença
de histerese ou de folgas de engrenagem, a saı́da u conterá componentes tanto
em sin quanto em cos para uma entrada puramente sin.
Para mostrar esse conceito, considere a estrutura de controle em que o dispo-
sitivo liga-desliga é um relé com histerese:
1
Para utilizar a expressão 1 + N (E)G(s) = 0 ou − N (E) = G(jω), é interessante
ter a fórmula para N (E)−1
v
u !2
1 πE u h h
− = − 1−
t +j (13.246)
N (E) 4M E E
π hp 2 i
= − E − h2 + jh (13.247)
4M
de modo que a parte imaginária é
( )
1 πh
Im − =− (13.248)
N (E) 4M
Em vista da presença de memória na linearidade considerada, a função des-
critiva é complexa. A condição de oscilação é caracterizada por
1
− = G(jω) (13.249)
N (E)
ou
π hp 2 i 1
− E − h2 + jh = (13.250)
4M s2 + s + 1 s=jω
π p 2 πh 1 − ω 2 − jω
− E − h2 − j = 2 (13.251)
4M 4M 1 − ω2 + ω2
Igualando as partes imaginárias, tem-se que
πh −ω
= 2 (13.252)
4M 1 − ω2 + ω2
Igualando as partes reais, tem-se que
π p 2 1 − ω2
− E − h2 = 2 (13.253)
4M 1 − ω2 + ω2
Inserindo-se os valores dos parâmetros do exemplo em questão, obtém-se que
−ω π × 10
2 = ≈ 0.393 (13.254)
1−ω 2 +ω 2 4 × 20
que leva à frequência de oscilação de ω ≈ 1.5 rd/s. Logo, em vista da expressão
π p 2 1 − 0.3932
− E − h2 = 2 = −0.328 (13.255)
4M 1 − 0.3932 + 0.3932
e em vista de h = 10 e M = 20, obtém-se E ≈ 13.0.
A solução pode ser obtida graficamente, traçando as curvas de Nyquist e de
N (E)−1 :
Apêndices 493
A condição de oscilação
1
G (jω0 ) = − (13.260)
N (E)
pode ser reescrita agrupando-se os termos reais e complexos
Na prática, com estruturas mais simples, pode-se fazer uma análise intui-
tiva do tipo: “se a amplitude da oscilação aumenta, então o ganho equivalente
diminui”.
Apêndices 495
em que
∆i = ki ∈ R (13.277)
em que
e, de II,
" # " # " #
I F I −F I + FG 0
det det = det (13.290)
0 I G I G I
= det (I + FG) (13.291)
−1
I + K(sI − A) B
ΦC (s) = det (sI − A) det (13.293)
| {z } | {z }
ΦO (s) GL (s)
ΦC (s)
det(I + GL (s)) = (13.294)
ΦO (s)
então
1 1
MG ≡ , (13.296)
1+α 1−α
!
−1 α −1 α
MF = −2 sin , 2 sin (13.297)
2 2
H
σi2 I + GL (jω) = λi
I + GL (jω) GL (jω)
(13.299)
| {z }
N⪰0
500 Engenharia de controle
−1
Para a matriz N = GH
L (jω) GL (jω), seja M tal que D = MNM é diagonal
h i
λi [I + N] = λi MM−1 + MDM−1 (13.300)
h i
= λi M(I + D)M−1 (13.301)
h
i
−1
= λ
i λ [I + D] λ M
[M] i i (13.302)
= λi [I + D] (13.303)
σ I + GL (jω) ≤ σi I + GL (jω) (13.304)
≤ 1 (13.305)
e
!
1 ϕi 1
− ≤ sin ≤ (13.307)
2 2 2
α α
−2 sin−1 = 60o ≤ ϕi ≤ 60o = 2 sin−1 (13.308)
2 2
para i = 1, 2, ..., m.
Apêndices 501
y = Cx (13.313)
ẏ = Cẋ
0
*
h i 0 1 0 h i 0
= c1 c2 0 0 0 1 x + c1 c2 0 0 u
−a31 −a32 −a33
1
h i
= 0 c1 c2 x (13.314)
N (s) c2 s + c1
G(s) = = 3 (13.316)
D(s) s + a33 s2 + a32 s + a31
502 Engenharia de controle
1
q0 =
c2
1
q1 = (c2 a33 − c1 )
c22
1 2
q2 = (c − a33 c1 c2 + a32 c22 )
c32 1
1
r0 = (−c31 + a33 c21 c2 − a32 c1 c22 + a31 c32 )
c32
N (s)
G(s) = (13.318)
Q(s)N (s) + R(s)
1
Q(s)
= (13.319)
1 R(s) Figura 13.14: Representação
1+ Q(s) N (s)
modificada de G(s).
Nessa representação, a malha fica carac-
terizada por
1
Y (s) = E(s) (13.320)
Q(s)
R(s)
W (s) = Y (s) (13.321)
N (s)
E(s) = U (s) − W (s) (13.322)
1
De Y (s) = Q(s) E(s), tem-se que
h i
Y (s) q0 s2 + q1 s + q2 = E(s) (13.323)
ou
e = q0 ÿ + q1 ẏ + q2 y (13.324)
Apêndices 503
ż1 = ẏ = z2 (13.325)
q1 q2 1
ż2 = ÿ = − ẏ − y + e (13.326)
q0 q0 q0
R(s)
e de W (s) = N (s) Y (s) verifica-se que
Em vista da expressão e = u − w,
q1 q2 1
ż2 = − ẏ − y + e (13.327)
q0 q0 q0
1
= − [−q1 ẏ − q2 y + u − w] (13.328)
q0
Usando o controle " #
h i z1
u= q2 q1 + w − q0 v (13.329)
z2
obtém-se
ż1 = z2 (13.330)
ż2 = v (13.331)
c2
ẇ = − w + r0 y (13.332)
c1
y = z1 (13.333)
u = −f (y) (13.337)
• (A, b) é controlável
• (A, c) é observável
• 1 + kU d > 0
y = cT x + du (13.343)
T
c x + du − y = 0 (13.344)
T 2
c xu + du − yu = 0 (13.345)
T 2
c xkU u + dkU u − kU yu = 0 (13.346)
T 2 2 2
c xkU u + dkU u − kU yu + u − u = 0 (13.347)
T 2
x ckU u + (1 + kU d) u − (u + kU y) u = 0 (13.348)
506 Engenharia de controle
resultando em
Lema de Kalman-Yakubovich-Popov
Fornecidas uma constante γ ≥ 0, uma matriz An×n cujos autovalores possuem
a parte real estritamente negativa, uma matriz Ln×n > 0 e vetores bn×1 e vn×1 ,
se
Re{T (jω)} > 0 , ∀ω ∈ R (13.354)
em que
γ
T (s) = vT (sI − A)−1 b + (13.355)
2
então ∃ ε > 0, qn×1 e Pn×n ≻ 0, tal que
AT P + PA = −qqT − εL (13.356)
√
Pb − v = γq (13.357)
■
Apêndices 507
+ (u + kU y) u (13.370)
2
= −εxT Lx − xT q −
p
1 + kU du + (u + kU y) u (13.371)
≤ −εxT Lx (13.372)
≤ 0 (13.373)
estabelecendo a estabilidade da malha fechada.
508 Engenharia de controle
• Re{λ{A}} < 0
• (A, b) controlável
• (A, c) observável
• 1 + kU d > 0
Caso kL ̸= 0
G(s)
G(s)
b = (13.375)
1 + kL G(s)
fb ∈ setor(0, kU − kL ) (13.376)
Apêndices 509
J(θMk+1
) na otimização utilizando a secção áu-
rea.
Passo 8: k := k + 1 e retornar % (fe-
cha o laço)
Passo 9: θ ≈ θkm
É interessante notar que a cada iteração é necessário calcular apenas 1 valor
J(θnovo , o que pode ser importante se, por exemplo, esse valor é obtido por
simulação numérica.
b
Passo 5: O mı́nimo de J ocorre aproximadamente em θ = − 2a
Observação: Para a aplicação em vista, não são necessários θA , θB e θC
genéricos, mas sim apenas o caso de θs igualmente espaçados de h. Mais
especificamente, θA = θ − h, θB = θ, θC = θ + h.
Assumindo que h ̸= 0, o sistema de equações se reduz para
dJ
= 0 (13.387)
dθ θ∗
2aθ∗ + b = 0 (13.388)
1 J(θA ) − J(θC )
θ∗ = h (13.390)
2 J(θA ) − 2J(θB ) + J(θC )
1 J(θA ) − J(θC )
θ∗ = θB + h (13.391)
2 J(θA ) − 2J(θB ) + J(θC )
1 J(θA ) − J(θC )
θ∗ ≈ θB + h (13.392)
2 J(θA ) − 2J(θB ) + J(θC )
Observações:
No passo 2, utiliza-se hk := −Dk ∇J T (θk ) que modifica a direção de busca.
h 2
i
No caso especial de Dk = H−1 (θk ) em que H(θk ) := ∂θ∂i ∂θJ
j
é a matriz Hes-
siana, tem-se o método de Newton.
O método de Newton possui velocidade de convergência maior que o da má-
xima declividade.
Em vista de possı́veis dificuldades em obter as segundas derivadas, requeridas
em H(θk ), e também devido à necessidade de inversão de matriz H−1 (θk ),
existem vários métodos que buscam obter aproximações de H(θk ) (ver, por
exemplo, (LUENBERGER, 1979) e (POLAK, 1971).
No passo 3, não é necessário obter λ∗ que minimiza J(λ),
e mas sim um λ∗ tal
∗ ∗
que J(λ ) < J(θk ). Um regra para obter tal λ é o de Armijo.
e e
Regra de Armijo
A proposta da regra de Armijo é buscar um
intervalo de λ tal que J(λ)
e < J(0),
e ou seja,
ao invés de buscar um ponto de mı́nimo,
aceita-se um ponto que reduz J.
e
Observando-se a figura 13.21,
J(λ)
e ≤ J(0)
e + εJe′ (0)λ (13.395)
J(λ
e k+1 ) > J(0)
e + εJe′ (0)λk+1 (13.396)
13.11.2 Otimização no Rn
Em muitos problemas de otimização paramétrica, θ ∈ Rn como o caso do con-
trolador PID (θ = [ KP , KI , KD ]).
Apenas para ilustração, apresenta-se aqui o método de Nelder-Mead (ou de po-
liedros flexı́veis), embora existam muitos outros algoritmos (vide, por exemplo,
(LUENBERGER, 2010), (IZMAILOV; SOLODOV, 2005), (HIMMELBLAU,
1972)).
com restrições.
Um enfoque alternativo é o da barreira que se utiliza
J(θ)
e = J(θ) + M B(θ) (13.402)
Condição de Kuhn-Tucker
Para verificar se um dado ponto θ é ótimo, necessita-se de algum critério como
o de Kuhn-Tucker.
Considere o problema de minimização
g1 (θ) ≤ 0 (13.405)
g2 (θ) ≤ 0 (13.406)
..
.
gm (θ) ≤ 0 (13.407)
No caso,
h i
J(θ∗ + h) ≈ J(θ∗ ) − hT λ1 ∇g1 θ∗ + λ2 ∇g2 θ∗
(13.410)
ou
Para que θ∗ + h não viole as restrições ativas g1 (θ∗ ) e g2 (θ∗ ), deve-se ter,
simultaneamente, ⟨hT |∇g1 (θ∗ )⟩ ≥ 0 e ⟨hT |∇g2 (θ∗ )⟩ ≥ 0.
Se h for uma direção tal que J(θ∗ + h) − J(θ∗ ) < 0 e de
519
520 Engenharia de controle
DORF, R.; BISHOP, R. Modern Control Systems. 7th. ed. Illinois: Addison
Wesley, 1995.
KUO, B. Digital Control Systems. Austin: Holt, Rinehart and Winston, 1980.
LJUNG, L. System Identification: Theory for the User. 2nd. ed. NY: Pearson,
1998.
MAYR, O. The Origins of Feedback Control. MIT: The M.I.T. Press, 1970.
SLOTINE, J.; LI, W. Applied Nonlinear Control. Illinois: Prentice Hall, 1991.
VEGTE, J. Van de. Feedback Control Systems. Illinois: Prentice Hall, 1990.
WITTE, R.; WITTE, J. Statistics. 11th. ed. Upper Saddle River: Wiley,
2017.
ZHOU, K.; DOYLE, J.; GLOVER, K. Robust and Optimal Control. Illinois:
Prentice Hall, 1995.
526
Apêndices 527
função iteração
de penalidade, 516 de Picard, 459
de transferência, 90
decrescente, 202 Jacquard, J.M., 22
delta de Dirac, 96
Kirchoff, 46
descritiva, 486
Kolmogorov, A.N., 166
fórmula
Kwakernaak, H., 347
de Joseph, 327
de Lucas, 473 Lagrange, 24, 123
Lagrangiano, 47
ganho
largura
de realimentação, 314
de banda, 112
Gauss, J.C.F., 166
Legendre, A.M., 166
gramiano
lema
de controlabilidade, 81
de Barbalat, 398, 481
de observabilidade, 84
KYP, 506
Hamilton, 24 LGR, 250
Hazen, H.L., 27 linearização, 72
Heaviside, 24, 123 harmônica, 484
Heron de Alexandria, 20 por realimentação da saı́da, 384
Hurwitz, A., 186 por realimentação de estado, 377,
378
identidade validade, 75
de Kalman, 332 LMI, 338
identificação LQG/LTR, 334
conceito, 153 LSE, 157
consistência, 204 LTI, 44
método do subespaço, 163 Luenberger, D.G., 347
não paramétrica, 153 Lyapunov
paramétrica, 153 primeiro método, 193
recursiva, 203 segundo método, 195
tempo contı́nuo, 202 Lyapunov, A.M., 24
IEEE
Control Award, 37 margem
IFAC, 33 de fase, 183
incertezas de ganho, 183
em modelos, 59 margens de estabilidade
politópicas, 345 controlador LQR, 332
inferência MIMO, 497
nebulosa, 413 Markov, A.A., 166
inserção de integrador, 318 matriz
Apêndices 529
tempo
Takashi Yoneyama
YONEYAMA
ENGENHARIA DE CONTROLE
Teoria e prática
fe
Esta obra busca oferecer aos estudantes e profissionais da área de Sistemas e
ENGENHARIA DE CONTROLE
Controle uma visão ampla, moderna e integrada do tema de modo simples, po-
rém sem prescindir de rigor formal. São apresentados os aspectos práticos rele-
vantes na prática com uma sólida base teórica que permite aprofundar o domínio
dos conceitos envolvidos. Cada tópico é ilustrado com exemplos numéricos e
complementados com exercícios de variadas dificuldades. Alguns detalhes mais
intrincados das ferramentas utilizadas nos projetos de controladores podem ser
encontrados na forma de apêndices.
fe
openaccess.blucher.com.br