Caro Alquimista,
Não tento presumir que sei mais sobre a Wikipédia, que qualquer um dos
aqui presentes.
Aliás, tanto o Alquimista como o Sr. Diego estão a ser humildes, dado
que além de pertencerem ao grupo de aprovação de bots pertencem ao grupo
restrito de 8 burocratas que regem atualmente a Wikipédia Portuguesa.
A questão é que, assim que aqui entrei, foi-me recordado que isto é uma
instituição politizada. Como tal, devo reger-me pelos seus termos
públicos objetivos, tal como os que mencionei, utilizando referências
das próprias ligações que me ofereceu.
Em termos wikipédicos, a Política de Bots é o
"texto legal" pelos
quais os bots devem reger-se, de uma forma
muito suscita.
A referência a legal, foi com intuito de aligeirar a conversa. Mas eu
explico. As palavras em texto jurídicos são sempre mais do que a sua
interpretação superficial (p.ex. memorando de entendimento).
O mesmo não se costuma passar com regulamentos.
Foi exatamente por considerar a página apresenta como "a lei da terra"
que me regi por ela. Exatamente por querer fazer as coisas de forma
aprovada é que me interessei pelo regulamento. Se existir algo relevante
mais objetivo e concreto, por favor, indique-me de forma a que eu o
analise e possa continuar com uma conversa informada, assim como a
procurar soluções que se enquadrem nos parâmetros já estabelecidos.
Se são regras, devo sabe-las em pormenor.
Sobre a parte específica dos corretores ortográficos,
o texto não
proíbe taxativamente qualquer correção de ortografia automática para
permitir que casos específicos possam ser corrigidos, coisas simples,
com uma taxa de erro residual e com o apoio da comunidade.
Esta foi a parte que eu li. Taxativamente não existe nada de objetivo.
Para mim, regras objetivas e números são importantes.
Quais são os parâmetros de análise?
Percentagem de falsos positivos e corpus de amostragem necessário (n)?
O que é considerado uma utilização de recursos computacionais
razoável por cada ciclo?
Foi isso que referi que iria ajustar com o começo do projeto, apesar de
o ter feito com termos de merceeiro de forma a que seja fácil para
qualquer um entender a lógica subjacente.
Dependendo dos critérios definidos, os meus critérios de seleção e
aperfeiçoamento de regras será ajustados.
Aliás, eu não quero envolver-me em ortografia, ou em questões de
gramática dúbias e polémicas que tendem a entreter académicos.
A secção portuguesa do LanguageTool separa as várias variantes, mas tem
uma componente que é comum a todas variantes.
É exatamente esse sub-conjunto de regras que é comum que será
trabalhado. O meu objetivo não é tornar a Wikipédia mais próxima do MEU
Português, mas torná-la mais próxima de um Português correto. Para isso
só serão utilizadas as regras comuns a todas as variantes.
No caso inglês, o caso é idêntico ao Lusófono, para um
bot poder
operar tem de cumprir a política e ser aprovado por um processo similar,
aliás, foi a baseado no anglófono que se instituiu a política e a
aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o
que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação
do minuto para poder verificar a solução apresentada?
Esse é o LanguageTool geral. Outras sub-ferramentas dão um extrato das
correções.
Para um excelente exemplo de ação de um bot semelhante:
https://ca.wikipedia.org/wiki/Especial:Contribucions/Langtoolbot
mas reafirmo o conselho de consultar as documentações,
envolver-se
com a comunidade e tentar perceber o seu funcionamento.
Já deve ter percebido, que eu até vejo documentação e de uma forma
séria. Mas reafirmo que não comecei a desenvolver.
Repare que o próprio Diego lhe indicou o Wikimedia
labs [0], ou
seja, não é preciso investir no alojamento / servidor,
Eu já tinha sido previamente informado desse recurso (que eu já
conhecia). Até analisar toda a informação necessária sobre ele, não me
posso comprometer a utilizá-lo. Dependendo de muitas questões distintas,
pode ser mais viável pagar pelo alojamento, apesar de qualquer poupança
ser bem-vinda. Muitas questão podem tornar essa alojamento inviável ou
indesejável. Nem tudo o que não rebato, indica que concordo.
De todos os modos, os custos máximos de alojamento que estimei são menos
de 8% do valor pedido para a proposta base, sem compromisso de
manutenção. Os custos máximos de alojamento seriam, também, para a
proposta máxima.
penso que em vez de bot, o mais apropriado seria uma
ferramenta lá.
Existem imensos projetos possíveis, incluso para outros idiomas
distintos. Mas a proposta é a que coloquei. Só são moldáveis os
critérios finais de aprovação e a forma como serão realizados.
envolver-se com a comunidade e tentar perceber o seu
funcionamento.
Quem é a comunidade?
Não é o que estou a fazer?
Estou a falar consigo, e já falei com mais algumas pessoas, algumas de
forma pública como pode constatar.
Mas...
A comunidade são:
os administradores;
os burocratas;
os utilizadores com contribuições;
ou
é o total de utilizadores?
Qual o modo mais fácil de contactar diretamente os 2 milhões de
utilizadores registados e fazer uma votação?
Seria interessante aferir a opinião da comunidade no seu todo desta
forma. É possível?
Espero que seja possível contar com o apoio dos membros mais experientes
para resolver estas questões, dado que não consegui encontrar Wikipédia
com este tipo de respostas.
Os melhores cumprimentos,
Tiago Santos
Às 18:04 de 08-04-2017, wikipt-request(a)lists.wikimedia.org escreveu:
Caro Tiago, grande parte do tempo que despendo para a
wikipédia anda em
redor de bots. Tenho vários a realizar inúmeras tarefas, maioritariamente
na wikipédia Lusófona mas por vezes sou solicitado noutros projetos, tal
como o Diego sou membro do Grupo de Aprovação de Bots, e a própria política
de bots fui eu que a elaborei e propus à comunidade. Não digo isto com o
intuito de o menosprezar, mas simplesmente que entenda que é a àrea onde
provavelmente estou mais à vontade, portanto o que pretendo é passar-lhe
algumas informações de que precisa para começar a compreender o
funcionamento da comunidade e dos procedimentos nesta área.
<< Isto não é um texto legal, portanto: "Corretores automáticos são
fortemente desencorajados" deve querer significar: "Corretores automáticos
são fortemente desencorajados", algo diferente de "correção de ortografia
não é permitida recorrendo a bots." >>
A política de bots é o conjunto das regras fundamentais pelas quais os
bots se devem reger, cada projeto tem as suas regras específicas, embora
todas andem em redor dos mesmos parâmetros. Este é um ponto essencial que
precisa perceber e ter em conta. Salvo casos especiais em tarefas
específicas e em projetos específicos, os bots precisam de aprovação por
parte da comunidade local, caso contrário são bloqueados, e em casos de
insistência tratados como vandalismo. Em termos wikipédicos, a Política de
Bots é o "texto legal" pelos quais os bots devem reger-se, de uma forma
muito suscita.
Sobre a parte específica dos corretores ortográficos, o texto não proíbe
taxativamente qualquer correção de ortografia automática para permitir que
casos específicos possam ser corrigidos, coisas simples, com uma taxa de
erro residual e com o apoio da comunidade.
No caso inglês, o caso é idêntico ao Lusófono, para um bot poder operar tem
de cumprir a política e ser aprovado por um processo similar, aliás, foi a
baseado no anglófono que se instituiu a política e a aprovação de bots
lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um
bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder
verificar a solução apresentada?
< Quanto à atribuição de estatutos, existe já um protocolo, que caso o
projeto se concretize, se irá realizar como parte do tempo de
desenvolvimento. >
Aqui parece haver confusão, a que protocolo se refere?
Estes são os pontos mais importantes que penso que convém analisar para já,
mas reafirmo o conselho de consultar as documentações, envolver-se com a
comunidade e tentar perceber o seu funcionamento. Repare que o próprio
Diego lhe indicou o Wikimedia labs [0], ou seja, não é preciso investir no
alojamento / servidor, e sinceramente, penso que em vez de bot, o mais
apropriado seria uma ferramenta lá.
Cordialmente,
Alchimista