{"id":3680,"date":"2015-01-15T11:04:10","date_gmt":"2015-01-15T14:04:10","guid":{"rendered":"https:\/\/mundobibliotecario.wordpress.com\/?p=3680"},"modified":"2015-01-15T11:04:10","modified_gmt":"2015-01-15T14:04:10","slug":"redes-complexas-auxiliam-na-classificacao-de-textos","status":"publish","type":"post","link":"https:\/\/mundobibliotecario.com.br\/index.php\/2015\/01\/15\/redes-complexas-auxiliam-na-classificacao-de-textos\/","title":{"rendered":"Redes complexas auxiliam na classifica\u00e7\u00e3o de textos"},"content":{"rendered":"<p><span class=\"small\">Assessoria de Comunica\u00e7\u00e3o <\/span>\u00a0\u00a014-Jan-2015<\/p>\n<p align=\"justify\">No Instituto de F\u00edsica de S\u00e3o Carlos (IFSC) da USP, pesquisa desenvolveu m\u00e9todos de classifica\u00e7\u00e3o de textos em categorias espec\u00edficas. O trabalho de Diego Raphael Amancio utiliza a modelagem por redes complexas, que transforma as palavras dos textos em partes de uma rede para obter caracter\u00edsticas espec\u00edficas de sua constru\u00e7\u00e3o, ou seja, do modo com que as palavras s\u00e3o combinadas. A rede ent\u00e3o \u00e9 submetida a sistemas de reconhecimento de padr\u00f5es de modo a classific\u00e1-los por estilo, complexidade e at\u00e9 identificar sua autoria. A t\u00e9cnica, que n\u00e3o exige processamento computacional complexo, pode ser adotada para aprimorar as t\u00e9cnicas convencionais de classifica\u00e7\u00e3o textual e tamb\u00e9m para apontar pl\u00e1gio e inconsist\u00eancias estil\u00edsticas, entre outras utilidades.<\/p>\n<p align=\"justify\">\n<p align=\"justify\">O estudo, orientado pelos professores Luciano da Fontoura Costa e Osvaldo Novais de Oliveira Junior, do IFSC, conquistou o 3\u00b0 Pr\u00eamio Tese Destaque USP, da Pr\u00f3-Reitoria de P\u00f3s-Gradua\u00e7\u00e3o da USP, categoria \u201cCi\u00eancias Exatas e da Terra\u201d, no \u00faltimo dia 5 de dezembro. Amancio conta que o problema de classifica\u00e7\u00e3o \u00e9 importante, por exemplo, para organizar a grande quantidade de dados gerados na Internet diariamente. \u201cA organiza\u00e7\u00e3o dos dados permite que as buscas se tornem mais r\u00e1pida\u201d, aponta. \u201cA pesquisa analisou o relacionamento entre as palavras no texto, ou seja, a estrutura textual, diferente dos estudos tradicionais, que verificam quais palavras est\u00e3o presentes no texto, isto \u00e9, o seu conte\u00fado sem\u00e2ntico.\u201d<\/p>\n<p align=\"justify\">\n<p align=\"justify\">O modelo de redes complexas, em sua concep\u00e7\u00e3o mais geral, \u00e9 utilizado para modelar uma grande quantidade de sistemas reais, como a internet, a world wide web, transportes, rela\u00e7\u00f5es sociais, biol\u00f3gicas etc. \u201cUma rede \u00e9 formada por um conjunto de v\u00e9rtices (pontos) ligados por arestas (conex\u00f5es)\u201d, diz o pesquisador. \u201cNo caso dos textos, cada palavra \u00e9 um v\u00e9rtice e duas palavras aparecem como conectadas se elas apareceram no texto como vizinhas pelo menos uma vez\u201d, diz. Na pesquisa, na maioria das aplica\u00e7\u00f5es, foram removidas as palavras sem conte\u00fado sem\u00e2ntico, como artigos e preposi\u00e7\u00f5es. Isto porque as principais propriedades estil\u00edsticas do textos s\u00e3o encontradas no relacionamento entre palavras de conte\u00fado.<\/p>\n<p align=\"justify\">\n<p align=\"justify\">Os textos analisados durante o estudo foram transformados em redes no computador para extra\u00e7\u00e3o de propriedades, como os caminhos m\u00ednimos (dist\u00e2ncia t\u00edpica entre duas palavras da rede), n\u00famero m\u00e9dio de vizinhos (quantidade m\u00e9dia de vizinhos de cada palavra na rede), coeficiente de aglomera\u00e7\u00e3o (densidade de conex\u00f5es entre vizinhos de uma dada palavra na rede) e centralidade (import\u00e2ncia de cada palavra na rede). \u201cCom essas medidas, cada texto foi caracterizado de acordo com o seu estilo ou estrutura. Todas estas medidas levam em considera\u00e7\u00e3o apenas as rela\u00e7\u00f5es de conectividade entre as palavras, sem analisar seu conte\u00fado\u201d, observa Amancio. Isso torna a modelagem gen\u00e9rica, de forma que ela pode ser aplicada, a princ\u00edpio, a qualquer idioma.<\/p>\n<p align=\"justify\">\n<p align=\"justify\"><strong>Caracteriza\u00e7\u00e3o dos textos<\/strong><\/p>\n<p align=\"justify\">A partir da caracteriza\u00e7\u00e3o dos textos, por meio da utiliza\u00e7\u00e3o de m\u00e9todos de reconhecimento de padr\u00f5es, foi poss\u00edvel identificar os autores de textos desconhecidos, classificar automaticamente o estilo liter\u00e1rio de livros e o sentido de palavras amb\u00edguas automaticamente. Tamb\u00e9m foi poss\u00edvel estabelecer n\u00edveis de complexidade dos escritos e identificar a natureza de manuscritos desconhecidos.<\/p>\n<p align=\"justify\">\n<p align=\"justify\">Amancio, atualmente professor do Instituto de Ci\u00eancias Matem\u00e1ticas e de Computa\u00e7\u00e3o (ICMC) da USP, em S\u00e3o Carlos, explica que cada aplica\u00e7\u00e3o do m\u00e9todo teve um teste espec\u00edfico. \u201cPor exemplo, na tarefa de reconhecimento de autoria, coletamos livros de v\u00e1rios autores, modelamos estes livros como redes e tentamos descobrir automaticamente que autor corresponde a cada livro\u201d, diz. \u201cA t\u00e9cnica foi capaz de executar v\u00e1rias tarefas de processamento de l\u00ednguas naturais apenas a partir da an\u00e1lise de conectividade das redes.\u201d<\/p>\n<p align=\"justify\">\n<p align=\"justify\">Por meio da t\u00e9cnica de redes complexas, foi poss\u00edvel tamb\u00e9m identificar as propriedades estat\u00edsticas do manuscrito Voynich, provavelmente produzido no s\u00e9culo XV, cujo conte\u00fado permanece desconhecido at\u00e9 os dias atuais. \u201cUma vez determinado o modo com que as palavras s\u00e3o combinadas no texto, a tradu\u00e7\u00e3o para a linguagem atual, que ir\u00e1 esclarecer o assunto do manuscrito, \u00e9 tarefa para cript\u00f3grafos\u201d, observa o pesquisador.<\/p>\n<p align=\"justify\">\n<p align=\"justify\">O m\u00e9todo n\u00e3o demanda muito processamento computacional, pois foi trabalhado com a modelagem de livros. \u201cAl\u00e9m das aplica\u00e7\u00f5es mencionadas, os m\u00e9todos desenvolvidos podem ser combinados com a estrat\u00e9gia de classifica\u00e7\u00e3o textual convencional\u201d, diz Am\u00e2ncio.\u00a0 \u201cPortanto, pode ainda ser \u00fatil para identificar pl\u00e1gio, spams, inconsist\u00eancias estil\u00edsticas, avalia\u00e7\u00e3o de qualidade de textos etc.\u201d<\/p>\n<p><strong>Mais informa\u00e7\u00f5es:<\/strong><br \/>\nContato: Diego Raphael Amancio<br \/>\nE-mail: <a href=\"mailto:diegoraphael@gmail.com\">diegoraphael@gmail.com<\/a><\/p>\n<p align=\"right\">\nPor J\u00falio Bernardes da Ag\u00eancia USP de Not\u00edcias<\/p>\n<p align=\"right\">Foto: Marcos Santos \/ USP Imagens<\/p>\n<p>Dispon\u00edvel em: &lt;<a href=\"http:\/\/www.saocarlos.usp.br\/index.php?option=com_content&amp;task=view&amp;id=19113&amp;Itemid=171\">http:\/\/www.saocarlos.usp.br\/index.php?option=com_content&amp;task=view&amp;id=19113&amp;Itemid=171<\/a>&gt;. Acesso em: 15 jan. 2015.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Assessoria de Comunica\u00e7\u00e3o \u00a0\u00a014-Jan-2015 No Instituto de F\u00edsica de S\u00e3o Carlos (IFSC) da USP, pesquisa desenvolveu m\u00e9todos de classifica\u00e7\u00e3o de textos em categorias espec\u00edficas. O trabalho de Diego Raphael Amancio utiliza a modelagem por redes complexas, que transforma as palavras dos textos em partes de uma rede para obter caracter\u00edsticas espec\u00edficas de sua constru\u00e7\u00e3o, ou &#8230; <a title=\"Redes complexas auxiliam na classifica\u00e7\u00e3o de textos\" class=\"read-more\" href=\"https:\/\/mundobibliotecario.com.br\/index.php\/2015\/01\/15\/redes-complexas-auxiliam-na-classificacao-de-textos\/\" aria-label=\"Read more about Redes complexas auxiliam na classifica\u00e7\u00e3o de textos\">Ler mais<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_mi_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"_jetpack_newsletter_access":"","footnotes":""},"categories":[60],"tags":[583],"class_list":["post-3680","post","type-post","status-publish","format-standard","hentry","category-noticias","tag-classificacao"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":false,"jetpack-related-posts":[{"id":5482,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2020\/01\/23\/google-cria-inteligencia-artificial-que-entende-livros-inteiros\/","url_meta":{"origin":3680,"position":0},"title":"Google cria Intelig\u00eancia Artificial que entende livros inteiros","author":"mundobibliotecario","date":"23\/01\/2020","format":false,"excerpt":"Quando se trata de m\u00fasicas, v\u00eddeos, textos e discursos, o maior desafio para a\u00a0Intelig\u00eancia Artificial\u00a0\u00e9 compreender o contexto que est\u00e1 sendo apresentado. Por exemplo, se durante um v\u00eddeo uma pessoa desaparecer e retornar posteriormente, muitos modelos v\u00e3o esquecer que ela j\u00e1 esteve l\u00e1. A\u00a0Google\u00a0enfrentou esse problema com o Transformer, uma\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":1052,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2010\/01\/12\/concurso-para-bibliotecario-unespbauru\/","url_meta":{"origin":3680,"position":1},"title":"Concurso para bibliotec\u00e1rio &#8211; UNESP\/Bauru","author":"mundobibliotecario","date":"12\/01\/2010","format":false,"excerpt":"UNIVERSIDADE ESTADUAL PAULISTA \u201cJ\u00daLIO DE MESQUITA FILHO\u201dCAMPUS DE BAURU - ADMINISTRA\u00c7\u00c3O GERAL EDITAL N\u00ba 12\/2009- DTAd-AG\/CBru - ABERTURA DE INSCRI\u00c7\u00d5ES CONCURSO P\u00daBLICO - Assistente de Servi\u00e7os de Documenta\u00e7\u00e3o, Informa\u00e7\u00e3o e Pesquisa - R$ 1.522,59 - Ensino M\u00e9dio Completo - Bibliotec\u00e1rio\u00a0- R$ 2.734,36 -\u00a0 Ensino Superior Completo em Biblioteconomia,\u00a0Registro no Conselho\u2026","rel":"","context":"Em &quot;Concurso&quot;","block_context":{"text":"Concurso","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/concurso\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":3731,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2015\/05\/31\/ccj-da-aval-a-projeto-de-classificacao-de-acervo-literario\/","url_meta":{"origin":3680,"position":2},"title":"CCJ d\u00e1 aval a projeto de classifica\u00e7\u00e3o de acervo liter\u00e1rio","author":"mundobibliotecario","date":"31\/05\/2015","format":false,"excerpt":"By ALAMO | Published: 27 DE MAIO DE 2015 Projeto de Lei 347\/15 determina que bibliotecas p\u00fablicas classifiquem obras conforme faixa et\u00e1ria. Na reuni\u00e3o da manh\u00e3 do dia\u00a019 de maio, a Comiss\u00e3o de Constitui\u00e7\u00e3o e Justi\u00e7a (CCJ) da Assembleia Legislativa de Minas Gerais (ALMG) aprovou parecer pela legalidade do Projeto\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"O Projeto de Lei 347\/15 segue agora para an\u00c3\u00a1lise da Comiss\u00c3\u00a3o de Cultura","src":"https:\/\/i0.wp.com\/blog.crb6.org.br\/wp-content\/uploads\/2015\/05\/Projeto-de-Lei-PL-347-15.jpg?resize=350%2C200","width":350,"height":200},"classes":[]},{"id":2714,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2012\/09\/15\/mecanismo-de-busca-identifica-contexto-opiniao-e-ajuda-a-prever-o-futuro\/","url_meta":{"origin":3680,"position":3},"title":"Mecanismo de busca identifica contexto, opini\u00e3o e ajuda a prever o futuro","author":"mundobibliotecario","date":"15\/09\/2012","format":false,"excerpt":"Informa\u00e7\u00f5es contextualizadas Inspirados pelas ideias propostas por um bibliotec\u00e1rio indiano h\u00e1 quase um s\u00e9culo, uma equipe europeia desenvolveu um novo sistema de buscas para a internet que leva em conta fatores como opini\u00e3o, contexto, tempo e localiza\u00e7\u00e3o. A nova tecnologia, que promete chegar ao mercado rapidamente, consegue mostrar tend\u00eancias na\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":347,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2009\/02\/06\/vaga-para-bibliotecario-em-votuporanga\/","url_meta":{"origin":3680,"position":4},"title":"Vaga para bibliotec\u00e1rio em Votuporanga","author":"mundobibliotecario","date":"06\/02\/2009","format":false,"excerpt":"DRH 0083-2009-01 SP 02.02.2009 EDITAL DE PROCESSO SELETIVO \u2013 N\u00ba 0083-2009-01 BIBLIOTEC\u00c1RIO DE\/BIBLIOTECA ESCOLAR \u2013 CE 435 VOTUPORANGA e P\u00f3lo 28 R$ 2.714,16 \u2013 40 horas semanais A Diretoria de Recursos Humanos do SESI-SP abre inscri\u00e7\u00f5es para candidatos interessados em participar do processo seletivo para provimento da vaga acima e\u2026","rel":"","context":"Em &quot;Emprego&quot;","block_context":{"text":"Emprego","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/emprego\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":5456,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2020\/01\/13\/conheca-3-ferramentas-gratuitas-para-produzir-conteudo-para-redes-sociais-em-bibliotecas\/","url_meta":{"origin":3680,"position":5},"title":"Conhe\u00e7a 3 ferramentas (gratuitas!) para produzir conte\u00fado para redes sociais em bibliotecas","author":"mundobibliotecario","date":"13\/01\/2020","format":false,"excerpt":"Recentemente, publiquei um post sobre como identificar o perfil dos usu\u00e1rios das redes sociais da biblioteca. Uma vez que voc\u00ea conhece quem \u00e9 o p\u00fablico, fica mais f\u00e1cil produzir o conte\u00fado, certo? Mas com o volume de informa\u00e7\u00f5es dispon\u00edvel hoje, \u00e9 imposs\u00edvel fazer esse trabalho sem utilizar ferramentas para produzir\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/mundobibliotecario.com.br\/wp-content\/uploads\/2020\/01\/image.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/pcbzwa-Xm","_links":{"self":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts\/3680","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/comments?post=3680"}],"version-history":[{"count":0,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts\/3680\/revisions"}],"wp:attachment":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/media?parent=3680"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/categories?post=3680"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/tags?post=3680"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}