O uso da inteligência artificial (ia) para elaboração de minutas de sentença em processos dos Juizados Especiais Federais do Maranhão: estudo comparativo de qualidade, sob a perspectiva de Robert Alexy, em distintos cenários de utilização

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/7065

Tipo do documento:	Dissertação
Título:	O uso da inteligência artificial (ia) para elaboração de minutas de sentença em processos dos Juizados Especiais Federais do Maranhão: estudo comparativo de qualidade, sob a perspectiva de Robert Alexy, em distintos cenários de utilização
Título(s) alternativo(s):	The use of artificial intelligence (AI) for drafting judgments in cases before the Federal Special Courts of Maranhão: a comparative quality study, from the perspective of Robert Alexy, in different usage scenarios.
Autor:	OLIVEIRA NETO, Valdemar Gomes de
Primeiro orientador:	BEZERRA, Eudes Vitor
Primeiro membro da banca:	BEZERRA, Eudes Vitor
Segundo membro da banca:	VELOSO, Roberto Carvalho
Terceiro membro da banca:	SOARES, Marcelo Negri
Resumo:	Investiga-se empiricamente a qualidade argumentativa de sentenças elaboradas por inteligência artificial generativa em comparação com sentenças humanas nos Juizados Especiais Federais da Seção Judiciária do Maranhão (JEFs/SJMA). O desenho experimental compara, processo a processo, a sentença humana original a três sentenças sintéticas geradas pelo Gemini 2.5 Pro em três cenários: Livre (comando aberto), Dirigido (resultado indicado) e Controlado (relatório estruturado e prompt com balizas normativas). A amostra é estratificada em 300 processos das matérias responsabilidade civil bancária, benefício de prestação continuada ao idoso (BPC-I) e à pessoa com deficiência (BPC-PCD). As 1.200 sentenças foram submetidas a tríplice codificação independente por avaliador humano cego, Claude Opus 4.5 e GPT-4.5, sob rubrica alexyana de seis dimensões (D1–D6), totalizando 3.600 codificações. Os testes de Friedman, Wilcoxon e Bonferroni demonstram que os três cenários de IA apresentam maior conformidade textual com os padrões da rubrica D1–D6 do que as sentenças humanas, com altíssima significância estatística e tamanho de efeito muito grande (Friedman χ²(3) > 308; p < 10⁻⁶⁶), com hierarquia idêntica nos três avaliadores: livre > dirigida > controlada > humana. A correlação entre avaliador humano e Claude Opus 4.5 (r = 0,936) evidencia calibração robusta do instrumento. As maiores diferenças concentram-se em D3 (justificação externa empírica) e D5 (saturação argumentativa), dimensões correspondentes às exigências do art. 489, §1º, do CPC/2015 mais frequentemente fragilizadas no contencioso de massa. No estrato bancário (n=18), a sentença humana supera os Cenários Dirigido e Controlado em todos os avaliadores; o Cenário Livre, contudo, supera a sentença humana em dois dos três avaliadores, achado que impede a generalização da vantagem humana em matérias principiológicas para todos os modos de IA. O fluxo automatizado de verificação confirma 75,5% das marcações suspeitas em sentenças humanas como imprecisões materiais reais (209/277), padrão compatível com reutilização de minutas-modelo. Conclui-se que a integração da IA generativa ao contencioso de massa é empiricamente sustentável, desde que operada com protocolos diferenciados por complexidade argumentativa da matéria, a saber, modalidade controlada para demandas regradas e probatórias e modalidade aberta ou auxiliar para demandas com colisão principiológica, com revisão humana qualificada como condição necessária e inafastável.
Abstract:	This dissertation empirically investigates the argumentative quality of sentences drafted by generative artificial intelligence compared with human judgments in the Federal Small Claims Courts of the Maranhão Judicial Section (JEFs/SJMA). The experimental design compares, case by case, the original human judgment with three synthetic sentences generated by Gemini 2.5 Pro across three scenarios: Free (open prompt), Directed (outcome indicated), and Controlled (structured report and normatively anchored prompt). The stratified sample comprises 300 cases covering banking civil liability, continued benefit for the elderly (BPC-I), and continued benefit for persons with disabilities (BPC-PCD). The 1,200 sentences were submitted to triple independent coding by a blind human evaluator, Claude Opus 4.5, and GPT-4.5, under an Alexy-derived six-dimension rubric (D1–D6), totaling 3,600 codings. Friedman, Wilcoxon, and Bonferroni tests demonstrate that AI-generated sentences present greater textual conformity with the D1–D6 rubric standards than human sentences, with very high statistical significance and very large effect size (Friedman χ²(3) > 308; p < 10⁻⁶⁶), with an identical hierarchy across all three independent evaluators: free > directed > controlled > human. The correlation between the human evaluator and Claude Opus 4.5 (r = 0.936) provides robust evidence of instrument calibration. The largest differences concentrate in D3 (empirical external justification) and D5 (argumentative saturation), the dimensions most frequently weakened in mass litigation under Article 489, §1, of the Brazilian Civil Procedure Code. In the banking stratum (n=18), the human sentence outperforms the Directed and Controlled scenarios across all evaluators; the Free scenario, however, surpasses the human sentence in two of three evaluators, a finding that prevents generalizing human advantage in principiological matters to all AI modes. The automated verification workflow confirms 75.5% of suspicious marks in human sentences as real material inaccuracies (209/277), a pattern consistent with reused boilerplate judgments. The dissertation concludes that the integration of generative AI into mass litigation adjudication is empirically sustainable, provided it operates through protocols differentiated by argumentative complexity, namely controlled mode for rule-based and evidentiary matters and open or auxiliary mode for principiological matters, with qualified human review as a necessary and non-waivable condition. Keywords:
Palavras-chave:	inteligência artificial generativa; argumentação jurídica; qualidade decisória; Juizados Especiais Federais; Resolução CNJ nº 615/2025; generative artificial intelligence;025. legal argumentation; decisional quality; Federal Small Claims Courts; CNJ Resolution No. 615/2
Área(s) do CNPq:	Direito
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	DEPARTAMENTO DE DIREITO/CCSO
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM DIREITO/CCSO
Citação:	OLIVEIRA NETO, Valdemar Gomes de. O uso da inteligência artificial (ia) para elaboração de minutas de sentença em processos dos Juizados Especiais Federais do Maranhão: estudo comparativo de qualidade, sob a perspectiva de Robert Alexy, em distintos cenários de utilização. 2026. 317 f. Dissertação (Programa de Pós-Graduação em Direito/CCSO) - Universidade Federal do Maranhão, São Luís, 2026.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/7065
Data de defesa:	16-Jun-2026
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM DIREITO E INSTITUIÇÕES DO SISTEMA DE JUSTIÇA - PPGDIR

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Anna_Carollina_Melo.pdf	Dissertação de Mestrado	1,2 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações