{"id":8457,"date":"2021-03-15T10:00:00","date_gmt":"2021-03-15T13:00:00","guid":{"rendered":"http:\/\/mundobibliotecario.com.br\/?p=8457"},"modified":"2021-03-14T11:40:37","modified_gmt":"2021-03-14T14:40:37","slug":"conheca-a-infraestrutura-de-armazenamento-do-internet-archive","status":"publish","type":"post","link":"https:\/\/mundobibliotecario.com.br\/index.php\/2021\/03\/15\/conheca-a-infraestrutura-de-armazenamento-do-internet-archive\/","title":{"rendered":"Conhe\u00e7a a infraestrutura de armazenamento do Internet Archive"},"content":{"rendered":"\n<p>O Internet Archive (IA) \u00e9 uma institui\u00e7\u00e3o sem fins lucrativos com sede em S\u00e3o Francisco, Calif\u00f3rnia, que oferece um acervo de&nbsp;<strong>m\u00fasicas; v\u00eddeos; filmes; livros; estudos; c\u00f3digo de websites, softwares e games de dom\u00ednio p\u00fablico<\/strong>, ou seja,&nbsp;<strong>que n\u00e3o s\u00e3o propriedade de um indiv\u00edduo ou organiza\u00e7\u00e3o<\/strong>. Al\u00e9m disso, oferece tamb\u00e9m&nbsp;<strong>servi\u00e7os de arquivo hist\u00f3rico de websites, com as ferramentas Archive-It e Wayback Machine<\/strong>.<\/p>\n\n\n\n<p>A hist\u00f3ria do IA comecou em 1996, quando a internet comercial ainda era pouco difundida. Atualmente, a organiza\u00e7\u00e3o oferece&nbsp;<strong>475 bilh\u00f5es<\/strong>&nbsp;de sites arquivados;&nbsp;<strong>28 milh\u00f5es<\/strong>&nbsp;de textos, livros e estudos;&nbsp;<strong>14 milh\u00f5es de \u00e1udios<\/strong>&nbsp;(<strong>sendo 220 mil<\/strong>&nbsp;shows ao vivo),&nbsp;<strong>6 milh\u00f5es<\/strong>&nbsp;de v\u00eddeos (sendo&nbsp;<strong>2 milh\u00f5es<\/strong>&nbsp;de programas de televis\u00e3o),&nbsp;<strong>3,5 milh\u00f5es<\/strong>&nbsp;de imagens e&nbsp;<strong>580 mil<\/strong>&nbsp;softwares. \u201cTemos mais de 20 anos de hist\u00f3ria da web acess\u00edvel por meio do Wayback Machine e trabalhamos com mais de 625 bibliotecas e outros parceiros por meio de nosso programa Archive-It\u201d, escreve o IA na p\u00e1gina \u201cSobre\u201d do site.<\/p>\n\n\n\n<p>De acordo com Jonah Edwards, gerente de opera\u00e7\u00f5es e infraestrutura do Internet Archive, para dar conta dessa quantidade assustadora de material, garantir a qualidade do servi\u00e7o e a privacidade de seus usu\u00e1rios,&nbsp;<strong>a organiza\u00e7\u00e3o n\u00e3o utiliza solu\u00e7\u00f5es de armazenamento em nuvem<\/strong>.&nbsp;<strong>Todos os arquivos upados no Internet Archive ficam armazenados nos mais de 20 mil discos r\u00edgidos<\/strong>, divididos entre os 750 servidores que ficam instalados ao redor da sede, na Calif\u00f3rnia.&nbsp;<strong>Um total de 200 petabytes de capacidade de armazenamento, ou melhor, 200 milh\u00f5es de gigabytes<\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/lh4.googleusercontent.com\/MU2vCTX_3z4qLPQNGBQcuANSypQcDmH86fjO6jDUGpuJ4IsCmvZ3fdHZTexWODqDxiYrN2_D8iVN2i-WtdWGwyNLrjJo5b59gsNTGP-mh9ixW9I0xOvhh61x4k3AgPPKi31Mfq-q\" alt=\"Mapa com a localiza\u00e7\u00e3o de 4 data centers do Internet Archive. Foto: Internet Archive.\"\/><figcaption><em>Mapa com a localiza\u00e7\u00e3o de 4 data centers do Internet Archive. Foto: Internet Archive.<\/em><\/figcaption><\/figure>\n\n\n\n<p><strong>O poder de armazenamento do Internet Archive cresce 25% por ano<\/strong>. Isso significa que novos discos r\u00edgidos s\u00e3o comprados constantemente para suprir a necessidade de armazenamento que s\u00f3 cresce. Segundo Jonah,&nbsp;<strong>o n\u00famero de acessos e a quantidade de material baixado do site cresceu assustadoramente durante a pandemia<\/strong>&nbsp;do novo coronav\u00edrus (COVID-19),&nbsp;<strong>que fez com que o IA investisse ainda mais em infraestrutura<\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/lh3.googleusercontent.com\/QsT4lu11QhIwbpnNguW-2AFkN_i16BJwavcncDozdWJOWDRs8I0XFuqwL-Q6iIJ0z9gldSR_OOxMmhrJ0LQgJaG3OrlUy7KWzQxsNr2fbbywzLtkdBImtZ0H3sg-0eJqPDRDW9gt\" alt=\"Funcion\u00e1rio carrega o equivalente a 10 petabytes de discos r\u00edgidos que foram adquiridos para integrar a infraestrutura do Internet Archive. Foto: Internet Archive.\"\/><figcaption><em>Funcion\u00e1rio carrega o equivalente a 10 petabytes de discos r\u00edgidos que foram adquiridos para integrar a infraestrutura do Internet Archive. Foto: Internet Archive.<\/em><\/figcaption><\/figure>\n\n\n\n<p>Jonah explica que&nbsp;<strong>a organiza\u00e7\u00e3o utiliza servidores locais<\/strong>, ao inv\u00e9s de solu\u00e7\u00f5es de armazenamento em nuvem&nbsp;<strong>principalmente pela quest\u00e3o do custo<\/strong>. Uma infraestrutura como essa vinda da Amazon Web Services (AWS), por exemplo, custaria muito mais do que j\u00e1 \u00e9 gasto com a estrutura f\u00edsica.<\/p>\n\n\n\n<p>Al\u00e9m disso, uma estrutura f\u00edsica tamb\u00e9m pode garantir alguns princ\u00edpios b\u00e1sicos do IA, como transpar\u00eancia, simplicidade, durabilidade, performance e longevidade. Quando h\u00e1 um problema com um disco, a equipe respons\u00e1vel consegue rastrear e corrigir com muito mais efici\u00eancia que os clientes de servi\u00e7os em nuvem conseguem.&nbsp;<strong>Outra vantagem de utilizar servidores locais, \u00e9 que o IA pode garantir a privacidade de seus usu\u00e1rios<\/strong>, j\u00e1 que servi\u00e7os em nuvem podem rastrear e coletar dados de uso de seus usu\u00e1rios.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"financiamento\">Financiamento<\/h3>\n\n\n\n<p>Jonah explica que o Internet Archive \u00e9 uma institui\u00e7\u00e3o caracterizada como arquivo e biblioteca, por esse motivo, podem acessar benef\u00edcios de financiamento do governo, principalmente os benef\u00edcios da Comiss\u00e3o Federal de Comunica\u00e7\u00f5es dos Estados Unidos (FCC). O IA tamb\u00e9m aceita doa\u00e7\u00e3o de empresas, usu\u00e1rios e outras institui\u00e7\u00f5es. Na p\u00e1gina \u201cSobre\u201d do site do IA \u00e9 poss\u00edvel encontrar&nbsp;<strong>uma lista com todas as fontes de renda da organiza\u00e7\u00e3o<\/strong>.<\/p>\n\n\n\n<hr class=\"wp-block-separator\"\/>\n\n\n\n<p><em><strong>Fonte: Internet Archive (<\/strong><\/em><a href=\"https:\/\/archive.org\/about\/\"><em><strong>1<\/strong><\/em><\/a><em><strong>) (<\/strong><\/em><a href=\"https:\/\/archive.org\/details\/jonah-edwards-presentation\"><em><strong>2<\/strong><\/em><\/a><em><strong>).<\/strong><\/em><\/p>\n\n\n\n<p>Texto: <a href=\"https:\/\/thehack.com.br\/author\/guilherme-petry\/\">Guilherme Petry<\/a><\/p>\n\n\n\n<p>Dispon\u00edvel em: <a href=\"https:\/\/thehack.com.br\/conheca-a-infraestrutura-de-armazenamento-do-internet-archive\/\">https:\/\/thehack.com.br\/conheca-a-infraestrutura-de-armazenamento-do-internet-archive\/<\/a>. Acesso em: 14 mar. 2021.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>O Internet Archive (IA) \u00e9 uma institui\u00e7\u00e3o sem fins lucrativos com sede em S\u00e3o Francisco, Calif\u00f3rnia, que oferece um acervo de&nbsp;m\u00fasicas; v\u00eddeos; filmes; livros; estudos; c\u00f3digo de websites, softwares e games de dom\u00ednio p\u00fablico, ou seja,&nbsp;que n\u00e3o s\u00e3o propriedade de um indiv\u00edduo ou organiza\u00e7\u00e3o. Al\u00e9m disso, oferece tamb\u00e9m&nbsp;servi\u00e7os de arquivo hist\u00f3rico de websites, com as &#8230; <a title=\"Conhe\u00e7a a infraestrutura de armazenamento do Internet Archive\" class=\"read-more\" href=\"https:\/\/mundobibliotecario.com.br\/index.php\/2021\/03\/15\/conheca-a-infraestrutura-de-armazenamento-do-internet-archive\/\" aria-label=\"Read more about Conhe\u00e7a a infraestrutura de armazenamento do Internet Archive\">Ler mais<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_mi_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"_jetpack_newsletter_access":"","footnotes":""},"categories":[1],"tags":[],"class_list":["post-8457","post","type-post","status-publish","format-standard","hentry","category-uncategorized"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"jetpack-related-posts":[{"id":4260,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2016\/05\/14\/acervo-de-36-anos-de-noticias-em-vhs-se-tornou-tesouro-do-internet-archive\/","url_meta":{"origin":8457,"position":0},"title":"Acervo de 36 anos de not\u00edcias em VHS se tornou tesouro do Internet Archive","author":"mundobibliotecario","date":"14\/05\/2016","format":false,"excerpt":"O Internet Archive, organiza\u00e7\u00e3o sem fins lucrativos que tem a miss\u00e3o de arquivar conte\u00fados de p\u00e1ginas antigas da web, ganhou uma rica colabora\u00e7\u00e3o. A organiza\u00e7\u00e3o recebeu a doa\u00e7\u00e3o de um acervo de 140 mil fitas VHS com registros hist\u00f3ricos do per\u00edodo entre 1976 e 2012, gravados pela norte-americana Marion Stokes.\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/i2.tudocdn.net\/img\/type28\/width646\/height284\/id172706_1.jpg?resize=350%2C200","width":350,"height":200},"classes":[]},{"id":8225,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2020\/12\/30\/o-library-explorer-do-internet-archive-torna-divertido-pesquisar-livros-online\/","url_meta":{"origin":8457,"position":1},"title":"O Library Explorer do Internet Archive torna divertido pesquisar livros online","author":"mundobibliotecario","date":"30\/12\/2020","format":false,"excerpt":"Fonte: Mashable Se voc\u00ea \u00e9 um nerd que sente falta de passar horas na biblioteca local, folheando milhares de t\u00edtulos e vagando pelas prateleiras, o\u00a0Library Explorer\u00a0pode ajudar a aliviar a tristeza.\u00a0Atualmente em beta, a interface permite que voc\u00ea navegue virtualmente em uma biblioteca \"f\u00edsica\". O projeto vem do\u00a0Internet Archive\u00a0- um\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":2816,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2013\/01\/28\/consulte-enciclopedias-e-bibliotecas-virtuais-de-todo-o-mundo\/","url_meta":{"origin":8457,"position":2},"title":"Consulte enciclop\u00e9dias e bibliotecas virtuais de todo o mundo","author":"mundobibliotecario","date":"28\/01\/2013","format":false,"excerpt":"Plataformas oferecem conte\u00fados em texto, \u00e1udio e v\u00eddeo em diversos idiomas Milhares de arquivos e documentos hist\u00f3ricos em apenas alguns cliques. Foto: Reprodu\u00e7\u00e3o Em mar\u00e7o deste ano, a famosa Encycloapedia Britannica deixou de circular em papel e passou a atuar apenas no universo digital. Uma consequ\u00eancia do avan\u00e7o da internet\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":647,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2009\/05\/17\/justica-avalia-acesso-do-google-a-bibliotecas\/","url_meta":{"origin":8457,"position":3},"title":"Justi\u00e7a avalia acesso do Google a bibliotecas","author":"mundobibliotecario","date":"17\/05\/2009","format":false,"excerpt":"JORNAL DO COMMERCIO, 30.04.09 - p. B8 Tecnologia Legisla\u00e7\u00e3o - Governo dos EUA estuda acordo entre gigante da Internet e duas associa\u00e7\u00f5es de autores e livros para oferecimento de conte\u00fado na rede DA REDA\u00c7\u00c3O O Departamento de Justi\u00e7a dos Estados Unidos est\u00e1 fazendo uma an\u00e1lise sobre um acordo coletivo acertado\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":3158,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2013\/07\/12\/biblioteca-digital-garante-acesso-sem-infringir-copyright\/","url_meta":{"origin":8457,"position":4},"title":"Biblioteca digital garante acesso sem infringir copyright","author":"mundobibliotecario","date":"12\/07\/2013","format":false,"excerpt":"Compartilhar conhecimento. O termo vive um momento de alta com a internet, mas a atividade \u00e9 t\u00e3o antiga quanto o homem. E uma das formas institucionais mais consolidadas de garantir acesso a informa\u00e7\u00f5es s\u00e3o as bibliotecas. \"Estamos tentando recriar digitalmente esse processo, para que n\u00e3o percamos a capacidade de acessar\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":2549,"url":"https:\/\/mundobibliotecario.com.br\/index.php\/2012\/04\/13\/portal-reune-teses-de-todo-o-mundo\/","url_meta":{"origin":8457,"position":5},"title":"Portal re\u00fane teses de todo o mundo","author":"mundobibliotecario","date":"13\/04\/2012","format":false,"excerpt":"Site traz trabalhos como os do fil\u00f3sofo Edgar Morin TAGS:\u00a0Centro para Comunica\u00e7\u00e3o Cient\u00edfica Direta,\u00a0disserta\u00e7\u00f5es,\u00a0Edgar Morin,\u00a0HAL,\u00a0Open Archive Initiative,teses,\u00a0trabalhos cient\u00edficos O portal franc\u00eas HAL, desenvolvido pelo Centro para Comunica\u00e7\u00e3o Cient\u00edfica Direta, disponibiliza na rede mais de 200 mil trabalhos cient\u00edficos do mundo inteiro e de todas as \u00e1reas do conhecimento. O acesso\u2026","rel":"","context":"Em &quot;Not\u00edcias&quot;","block_context":{"text":"Not\u00edcias","link":"https:\/\/mundobibliotecario.com.br\/index.php\/category\/noticias\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/revistacult.uol.com.br\/home\/wp-content\/uploads\/2012\/04\/Edgar-Morin-2.jpg?resize=350%2C200","width":350,"height":200},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/pcbzwa-2cp","_links":{"self":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts\/8457","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/comments?post=8457"}],"version-history":[{"count":1,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts\/8457\/revisions"}],"predecessor-version":[{"id":8458,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/posts\/8457\/revisions\/8458"}],"wp:attachment":[{"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/media?parent=8457"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/categories?post=8457"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mundobibliotecario.com.br\/index.php\/wp-json\/wp\/v2\/tags?post=8457"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}