Para treinar uma IA que guia um robô ortopédico, você precisa de milhares de casos clínicos com imagens de TC, prontuários, dados biomecânicos e desfechos cirúrgicos. Para acessar esses dados, você precisa de consentimento, aprovação ética, anonimização e conformidade com a LGPD. O paradoxo é real — e os dados sintéticos são a solução mais elegante que a ciência produziu para resolvê-lo.
Esta não é uma pauta futurista. Em 2025, redes neurais generativas já produzem radiografias, tomografias e prontuários fictícios estatisticamente indistinguíveis dos reais. Robôs cirúrgicos como o ROSA Knee e o MAKO são treinados e validados sobre ambientes simulados onde nenhum paciente real precisa estar presente. E no Brasil, onde mais de 150 sistemas Da Vinci operavam em 2023 e mais de 30 novas plataformas robóticas aguardam aprovação da ANVISA, essa tecnologia chega em momento decisivo.
O paradoxo dos dados médicos e sua solução sintética
A inteligência artificial precisa de dados para aprender. Quanto mais dados, mais precisos os modelos — e mais seguros os robôs que eles orientam. Mas dados médicos são, por definição, os mais sensíveis que existem: são dados de saúde, categoria especialmente protegida pela LGPD (Art. 11), pelo GDPR europeu e por todas as legislações de privacidade relevantes globalmente.
A saída para esse impasse surgiu de uma tecnologia originalmente criada para gerar rostos humanos falsos: as Redes Generativas Adversariais (GANs). Em medicina, elas aprendem os padrões estatísticos de dados reais e produzem registros sintéticos que preservam todas as relações clínicas relevantes — sem que nenhum daqueles dados pertença a qualquer paciente real identificável.
O que são dados sintéticos em saúde
Dados sintéticos médicos são registros gerados artificialmente por modelos de aprendizado de máquina — GANs, VAEs (Autoencoders Variacionais) ou LLMs — que preservam as propriedades estatísticas e clínicas dos dados reais sem conter informação identificável de qualquer indivíduo. Eles incluem prontuários eletrônicos tabulares, imagens radiológicas (Rx, TC, RM), sinais fisiológicos (ECG, EMG) e modelos biomecânicos tridimensionais.
A distinção crítica para a LGPD: dados sintéticos não são dados anonimizados (que derivam de dados reais e correm risco de reidentificação). São dados que nunca foram reais. Não há titular. Não há vazamento possível.
Como a IA fabrica pacientes que nunca existiram
O mecanismo central por trás dos dados sintéticos em medicina é a GAN — uma arquitetura criada por Ian Goodfellow em 2014 e que funciona como um duelo entre dois modelos neurais. Compreender como ela opera é fundamental para entender tanto as possibilidades quanto os limites da tecnologia.
O resultado de centenas de rodadas de treinamento é um modelo capaz de gerar imagens de TC de joelho com osteoartrose grau II, prontuários de pacientes fictícios de 68 anos com fratura transtrocantérica e curvas de recuperação pós-artroplastia — todos estatisticamente consistentes com a realidade clínica, todos juridicamente inexistentes como dados pessoais.
Dado técnico — Geração de imagens ortopédicas sintéticas
Uma revisão sistemática publicada no PMC em 2025, analisando 72 estudos sobre GANs em saúde, documentou que MRI e TC são as modalidades mais utilizadas para geração sintética, com as arquiteturas cGAN e CycleGAN respondendo por 49% dos estudos combinados. Na ortopedia especificamente, o modelo ReconGAN já foi aplicado para simular a microestrutura trabecular óssea e prever o risco de fratura a partir de micro-TC — sem necessitar de um único escaneamento real para validação final.
O gêmeo digital do paciente: o próximo nível dos dados sintéticos
Se os dados sintéticos tabulares e as imagens geradas por GAN são a fundação, o Digital Twin Cirúrgico é o edifício. Publicado em maio de 2025 na npj Digital Medicine (Nature), o conceito já tem aplicações clínicas certificadas em ortopedia.
Definição — Digital Twin em Cirurgia (npj Digital Medicine, 2025)
Um gêmeo digital em cirurgia é uma réplica virtual dinâmica do estado físico e fisiológico de um indivíduo, integrando sistemas corporais e interações de saúde. Combina princípios científicos fundamentais com modelagem orientada a dados para criar uma réplica sincronizada que se atualiza em intervalos e níveis de precisão definidos.
Em ortopedia, esses modelos já permitem a simulação virtual de implantes antes da cirurgia, predição de distribuição de stress em implantes após revisão e otimização de estratégias de fixação — tudo sobre o paciente virtual, sem risco para o paciente real.
A empresa francesa Twinsight oferece tecnologia de gêmeo digital específica para ortopedia, habilitando simulação virtual do posicionamento de próteses de joelho e quadril antes da operação. O framework Twin-S foi desenvolvido para cirurgia da base do crânio e captura o progresso cirúrgico em tempo real, atualizando o modelo virtual durante o procedimento. Na ortopedia traumatológica, um estudo publicado na Scientific Reports em junho de 2025 aplicou gêmeos digitais em cinco casos reais de pseudartrose, demonstrando capacidade de prever melhorias na distribuição de stress do implante antes mesmo da revisão cirúrgica.
Dados sintéticos e cirurgia robótica: a conexão direta
Para entender por que dados sintéticos importam para a cirurgia robótica, é preciso entender como os robôs ortopédicos aprendem. Sistemas como o ROSA Knee (Zimmer Biomet) e o MAKO (Stryker) não são “programados” no sentido tradicional — eles são treinados. Seus algoritmos de visão computacional, planejamento de trajetória e ajuste intraoperatório foram desenvolvidos sobre enormes volumes de casos cirúrgicos.
O desafio: reunir esses volumes de dados reais — com todas as variações anatômicas, graus de artrose, deformidades e comorbidades que um robô pode encontrar em campo — é logisticamente impossível usando apenas dados reais com consentimento e conformidade regulatória. É aqui que os dados sintéticos entram como acelerador.
Treinamento de visão computacional
GANs geram TC e RM sintéticas de joelhos com graus variados de artrose, alinhamentos anormais e implantes anteriores — treinando o robô para reconhecer e adaptar-se a variações raras sem expor casos reais.
Simulação de trajetória cirúrgica
Modelos biomecânicos de pacientes virtuais permitem simular a resistência óssea, resposta ao corte e comportamento do tecido mole — calibrando o feedback háptico do robô sem necessidade de cadáveres ou estudos em humanos.
Validação de implantes personalizados
Dados sintéticos permitem simular milhares de pacientes virtuais para validar novos implantes antes dos estudos clínicos — reduzindo o tempo de aprovação regulatória e o tamanho amostral necessário.
Treinamento de cirurgiões em simulador
Simuladores de artroscopia com VR e haptic feedback já demonstraram melhora significativa de habilidades em três sessões de treinamento em artroscopia de quadril — sem risco a pacientes reais.
Caso NVIDIA ORBIT-Surgical + ORBIT Isaac Sim
A NVIDIA publicou em janeiro de 2025 no seu blog técnico a plataforma ORBIT-Surgical, um framework de simulação fotorrealística para robótica cirúrgica com modelos de órgãos humanos em código aberto. A plataforma usa gêmeos digitais anatômicos sintéticos para treinar políticas de robótica cirúrgica via behavior cloning e aprendizado por imitação — sem necessitar de qualquer dado de paciente real. O código e os assets estão disponíveis no GitHub para pesquisadores e desenvolvedores.
Complementarmente, o sistema SRT-H de Johns Hopkins e Stanford, que realizou em julho de 2025 a primeira colecistectomia autônoma da história em tecido humano ex-vivo, foi treinado com “milhares de vídeos de cirurgias humanas, linguagem natural e simulações anatômicas” — combinação de dados reais e sintéticos que viabilizou o treinamento sem exposição irrestrita de pacientes.
Brasil, LGPD e o ambiente regulatório para dados sintéticos
No Brasil, o desenvolvimento e uso de IA em saúde enfrenta um ambiente regulatório em amadurecimento — mas com balizas claras que tornam os dados sintéticos especialmente relevantes.
- LGPD — Lei 13.709/2018
Dados de saúde são categoria especial — exigem bases legais específicas
O Art. 11 da LGPD classifica dados de saúde como dados sensíveis, com tratamento sujeito a bases legais mais restritivas: consentimento explícito, tutela da saúde ou pesquisa com anonimização. Dados sintéticos não configuram dados pessoais — e portanto não têm titular, não exigem consentimento e não se enquadram nas restrições da lei.
- Resolução CFM nº 361/2025
Marco regulatório de IA médica entra em vigor no Brasil em junho de 2025
A Resolução nº 361/2025 do CFM, em vigor desde junho, regula o uso de IA em medicina no Brasil. O uso de simulações e modelos virtuais para treinamento e planejamento cirúrgico está alinhado com seu princípio de supervisão médica — o “human in the loop” que a comunidade científica defende como princípio de design dos gêmeos digitais.
- Cenário robótico brasileiro — 2025-2026
Mais de 30 novas plataformas aguardam aprovação da ANVISA
Em 2023, mais de 150 sistemas Da Vinci operavam no Brasil. Segundo o urologista Aníbal Branco, ouvido pelo CREMERJ, “mais de 30 novas plataformas — grande parte de origem asiática — prometem baratear o mercado”, com expectativa de aprovação pela ANVISA. Quanto mais plataformas, maior a demanda por dados de treinamento — tornando os dados sintéticos uma necessidade técnica crescente.
- Horizon — 2026-2030
Marco legal específico para dados sintéticos em saúde ainda está por vir
A ANPD (Autoridade Nacional de Proteção de Dados) ainda não publicou orientação específica sobre dados sintéticos. O CFM e o CREMERJ debatem o tema, mas sem regulamentação detalhada. Pesquisadores e gestores hospitalares que desejam adotar a tecnologia precisam operar com pareceres jurídicos individuais e documentação robusta de que os dados não derivam de qualquer titular identificável.
Atenção — O risco real: dados sintéticos não são imunes a falhas
A literatura é clara sobre as limitações. GANs treinadas sobre dados reais podem, em casos de bases pequenas, memorizar padrões individuais — tornando tecnicamente possível, em condições adversariais específicas, inferir características de casos reais. Esse risco é mitigado por técnicas de differential privacy — como o framework RDP-CGAN (Rényi Differential Privacy) — que adicionam ruído matemático calibrado ao processo de treinamento, com garantias formais de privacidade.
A mensagem regulatória prudente: dados sintéticos são uma poderosa ferramenta de preservação de privacidade, mas requerem implementação técnica cuidadosa — não são uma solução automática de conformidade apenas por serem “artificiais”.
O dado sintético não é uma cópia anonimizada de um paciente real. É um paciente que nunca existiu — e que, por isso, pode treinar robôs, validar implantes e ensinar cirurgiões sem que nenhum titular seja exposto.
Aplicações concretas em ortopedia — o estado da arte em 2026
| Aplicação | Tecnologia sintética | Evidência / Fonte | Maturidade |
|---|---|---|---|
| Planejamento pré-operatório de ATQ/ATJ com IA | TC sintética + modelo 3D + AI planning | 1,2M TC reais → sistema AIHIP (Chen et al., 2025). Dados sintéticos para augmentação e validação cruzada | Clínico |
| Previsão de risco de fratura em osteoporose | ReconGAN — microestrutura óssea trabecular sintética | Micro-CT sintético para prever risco de fratura sem necessidade de novas amostras (Ahmadian et al., 2025) | Pesquisa avançada |
| Treinamento de robôs para colocação de parafusos pediculares | Simulação anatômica + reinforcement learning | Stanford: 42% redução no tempo, 0,8% complicações em 120 cirurgias espinhais — sistema treinado com simulação (MedComm, 2025) | Clínico |
| Simulação de posicionamento de prótese de joelho/quadril | Digital Twin (Twinsight, Axial3D) | npj Digital Medicine (2025): Digital twins testados para ATJ/ATQ em ortopedia — “virtual examination of implants before operations” | Implementação |
| Treinamento cirúrgico em artroscopia | Simulador VR com haptic feedback + anatomia sintética | Melhora em todos os parâmetros após 3 sessões em simulador de artroscopia de quadril (npj Digital Medicine, 2025) | Clínico |
| Pseudartrose — planejamento de revisão cirúrgica | Digital twin integrado com captura de movimento e FEM | 5 casos aplicados — predição de melhora na distribuição de stress pré-revisão (Scientific Reports, jun/2025) | Casos clínicos |
| Detecção de fraturas e lesões em imagem | GAN para augmentação de dataset com casos raros | Acurácia de até 98% em detecção de fraturas e até AUC 0,89–0,98 em LCA com datasets augmentados | Clínico |
| Cirurgia robótica autônoma (horizonte) | LLM + simulação sintética + behavior cloning (NVIDIA ORBIT) | SRT-H (Johns Hopkins/Stanford): colecistectomia autônoma ex-vivo, julho/2025. Treinamento em simulação sintética + vídeos reais | Experimental |
Desafios não resolvidos — o que a tecnologia ainda não garante
A narrativa em torno dos dados sintéticos em saúde precisa ser honesta sobre suas limitações. Três problemas persistem e merecem atenção do pesquisador, do gestor hospitalar e do regulador brasileiro.
Viés algorítmico amplificado
Se os dados reais de treinamento da GAN forem enviesados — sub-representando mulheres, pacientes negros ou populações de baixa renda — os dados sintéticos amplificarão esses vieses. Um robô treinado sobre anatomias sub-representadas pode ter performance inferior justamente nas populações que mais precisariam de acesso à tecnologia.
Custo computacional elevado
Treinar uma GAN de qualidade médica para imagens de TC ou RM pode levar semanas em GPUs de alto desempenho. Isso limita o acesso da pesquisa brasileira — concentrada em centros sem essa infraestrutura — a utilizar modelos pré-treinados de outras populações, com risco de distribuição descolada da realidade nacional.
Falta de métricas padronizadas
Não há consenso sobre como avaliar a “qualidade clínica” de um dado sintético ortopédico. O FID (Fréchet Inception Distance) mede similaridade estatística, mas não validade biomecânica. Um implante sinteticamente plausível pode ser cirurgicamente impraticável — e os modelos atuais não distinguem essas dimensões.
Marco regulatório incompleto no Brasil
A ANPD ainda não publicou guideline específico para dados sintéticos em saúde. Hospitais e empresas de MedTech que desejam desenvolver robótica baseada em dados sintéticos precisam operar em zona jurídica de incerteza — com interpretação conservadora da LGPD e pareceres legais individuais.
Perguntas técnicas e regulatórias
Dados sintéticos estão cobertos pela LGPD? Precisam de consentimento?
Não, se gerados corretamente. A LGPD regula “informação relacionada a pessoa natural identificada ou identificável” (Art. 5º, I). Dados sintéticos gerados por GANs que não derivam de qualquer indivíduo específico não configuram dados pessoais e, portanto, não têm titular e não exigem consentimento. O ponto crítico é garantir que o processo de geração — especialmente com técnicas de differential privacy — impeça matematicamente a inferência de qualquer caso real do conjunto de treinamento. Recomenda-se documentação robusta do processo e, preferencialmente, parecer da ANPD ou jurídico especializado antes de implementações de grande escala.
Qual a diferença entre dados sintéticos e dados anonimizados?
A diferença é fundamental. Dados anonimizados derivam de dados reais de pacientes identificáveis — o processo remove identificadores, mas a informação original existiu. Há sempre risco residual de reidentificação (especialmente com cruzamento de bases). Dados sintéticos nunca foram dados reais: são criados por um modelo que aprendeu padrões estatísticos, mas não memoriza casos individuais (quando bem implementado). Para a LGPD, dados verdadeiramente sintéticos não são “tratamento de dados pessoais” — são criação de dados novos.
O hospital brasileiro pode desenvolver suas próprias GANs para treinar robôs?
Tecnicamente, sim — com os recursos computacionais adequados. O fluxo seria: (1) obter aprovação do CEP para uso dos dados reais no treinamento da GAN; (2) treinar o modelo com técnicas de differential privacy; (3) validar clinicamente os dados sintéticos gerados; (4) usar esses dados sintéticos para treinar e validar algoritmos robóticos sem necessidade de novo acesso aos dados reais. Na prática, a maioria dos hospitais brasileiros não tem a infraestrutura de GPU necessária — sendo mais viável adotar plataformas como NVIDIA ORBIT-Surgical (código aberto) ou parceiros comerciais com modelos pré-treinados.
Os robôs ROSA Knee e MAKO que operam no Brasil já usam dados sintéticos?
As empresas (Zimmer Biomet e Stryker) não divulgam publicamente os detalhes técnicos dos seus processos de treinamento de IA. O que se sabe — a partir da literatura e comunicações técnicas — é que ambas as plataformas combinam dados clínicos reais com simulação computacional extensiva para desenvolver e validar seus algoritmos. A tendência de mercado em 2025-2026 é crescente adoção de dados sintéticos nas fases de desenvolvimento e validação pré-clínica. Para confirmação específica por plataforma, o contato com os departamentos técnicos de cada fabricante é necessário.
Como a cirurgia robótica e a IA tratam a responsabilidade médica no Brasil?
Essa é uma das questões mais debatidas no I Fórum de Saúde Digital do CFM. Segundo análises jurídicas citadas pela Academia Médica, “a responsabilidade tende a ser compartilhada entre o médico, o fornecedor do software, o desenvolvedor do algoritmo e a entidade que forneceu os dados usados para treinamento da IA”. A Resolução CFM nº 361/2025 reforça que a decisão final sempre é do médico — o robô é instrumento, não agente decisório autônomo. Com dados sintéticos, acrescenta-se uma camada: quem gerou os dados e como garante sua validade clínica?
Conclusão: o problema de privacidade que a ortopedia robótica não podia resolver — até agora
A medicina de precisão robótica tem um problema fundamental: ela precisa de dados em escala industrial para se tornar segura — e os dados que ela precisa são os mais protegidos que existem. Durante anos, esse paradoxo freou o desenvolvimento de algoritmos mais precisos, limitou a diversidade dos dados de treinamento e criou barreiras regulatórias que beneficiavam quem já tinha acesso a grandes volumes de dados reais.
Os dados sintéticos — e, em sua expressão mais sofisticada, os gêmeos digitais cirúrgicos — são a solução técnica mais elegante produzida para resolver esse paradoxo. Eles permitem gerar populações inteiras de pacientes virtuais, com anatomias diversas, comorbidades variadas e padrões de recuperação realistas, sem que nenhum titular seja envolvido, sem que nenhum consentimento seja necessário, sem que nenhuma violação de privacidade ocorra.
Para o Brasil, onde a cirurgia robótica cresce aceleradamente mas a infraestrutura regulatória ainda amadurece, isso representa uma oportunidade estratégica: desenvolver tecnologia de ponta em conformidade com a LGPD, em vez de importar modelos treinados sobre populações de outros países que não refletem a diversidade anatômica, epidemiológica e social do paciente brasileiro.
O paciente virtual que nunca existiu pode ser, ironicamente, o que mais protege os pacientes reais.
Referências Científicas e Fontes
- Han F et al. Artificial Intelligence in Orthopedic Surgery: Current Applications, Challenges, and Future Directions. MedComm. 2025 Jun;6(7):e70260. PMC12188104
- Wang GC et al. Artificial intelligence in orthopedics: fundamentals, current applications, and future perspectives. Mil Med Res. 2025 Aug;12:42. doi: 10.1186/s40779-025-00633-z
- Mendes JM, Barbar A, Refaie M. Synthetic data generation: a privacy-preserving approach to accelerate rare disease research. Front. Digit. Health. 2025. doi: 10.3389/fdgth.2025.1563991
- Haque A et al. Generative adversarial networks and synthetic patient data: current challenges and future perspectives. Future Healthcare Journal. PMC. PMC9345230
- Khan S et al. Utilizing GANs for Preserving Privacy in Developing ML Models for Healthcare. DATA 2025 Conference. doi: scitepress
- Asciak L et al. Digital twin assisted surgery: concept, opportunities, and challenges. npj Digit. Med. 2025;8:32. doi: 10.1038/s41746-024-01413-0
- Luijten G et al. Digital twins for the era of personalized surgery. npj Digit. Med. 2025 May;8:283. doi: 10.1038/s41746-025-01575-5
- Oehme S et al. Advantages of digital twin technology in orthopedic trauma surgery — exploring different clinical use cases. Sci. Rep. 2025;15:19987. doi: 10.1038/s41598-025-04792-w
- Zhao et al. Current progress of digital twin construction using medical imaging. J Appl Clin Med Phys. 2025. doi: 10.1002/acm2.70226
- Liu et al. Evolution of Surgical Robot Systems Enhanced by Artificial Intelligence: A Review. Adv Intell Syst. 2024. doi: 10.1002/aisy.202300268
- Wongsak S et al. AI in Orthopaedics: Clinical Performance, Limitations, and Translational Readiness. J Clin Med. 2026;15(5):1751. doi: 10.3390/jcm15051751
- Tasdemirci C et al. Review on the utility of artificial intelligence in robotic surgery. Curr Probl Surg. 2026;74:101941. doi: 10.1016/j.cpsurg.2025.101941
- NVIDIA Technical Blog. Advancing Surgical Robotics with AI-Driven Simulation and Digital Twin Technology. Jan 2025. developer.nvidia.com
- Saúde Digital News. Cirurgia robótica: robô operando sozinho com IA redesenhando a medicina. Jul 2025. (SRT-H, Johns Hopkins/Stanford)
- CREMERJ News. Cirurgias robóticas devem revolucionar cuidados médicos até 2035. Set 2024. (Cenário Brasil — robótica e ANVISA)
- CFM. Resolução nº 361/2025 — Regulamentação de IA na Medicina. Jun 2025.
- Lei nº 13.709/2018 (LGPD) — Art. 5º (definição de dado pessoal) e Art. 11 (dados sensíveis de saúde).
- Khan F et al. Synthetic Data Generation for Healthcare: Exploring GAN Variants for Medical Tabular Data. Int. J. Data Sci. Anal. 2025. doi: 10.1007/s41060-025-00816-w
Portal da Ortopedia · Artigo técnico de caráter informativo e científico.
Não constitui orientação regulatória ou jurídica. Para implementações institucionais, consulte especialistas em privacidade de dados e conformidade LGPD.