sexta-feira, 29 de abril de 2011

MakeNews

Acho que meu chefe lê esse blog, pois, depois do último post que dizia que eu tinha acabado com todas as tasks, recebi um monte de programas e alterações para fazer, alguns com prioridade baixa e outros com nível A+ de prioridade.

Agora que matei todas essas tasks me restou uma: o MakeNews. =/

Essa é difícil, preciso pegar os padrões das tags que são usadas antes do conteúdo do post que cada site e fazer um strpos para colocar o ponteiro certinho no começo do conteúdo do post e fazê-lo parar ao final.

Consegui, peguei o título e o texto. Fácil. Contudo, (ahh essa palavra sempre vem para estragar as coisas) por algum motivo que eu desconheça meu pequeno robô está pegando apenas o último parágrafo do post. muito estranho afinal uso o strpos para colocar o ponteiro no local e mando armazenar numa variável tudo que vem depois do conteúdo que comparei com o substr.

Vou explicar melhor:
-> Uso cURL para pegar todo o conteúdo de uma página e armazeno em um arquivo txt;
-> Pego o conteúdo desse txt e coloco em uma variável;
-> Faço uma comparação com a função substr() para achar a tag html em que o post se inicia;
-> Quando a comparação for verdadeira ele usa a strpos() e coloca o ponteiro logo depois dessa tag;
-> O mesmo vale para achar o final do post.

A lógica está certa, mas tem algum bug. Bora descobrir onde está?

2 comentários:

  1. Não é que eu já consegui achar o bug? =OOOOOOO

    FUUUUUUUUUUUUUUUUUUU UUUUUUUUUUUUU

    uahsuauhsuausuhausa

    Bem, agora vou fazer um select para que o usuário possa escolher de qual site tirar a notícia..

    Detalhe: NENHUM desses sites tem RSS!!!!!!

    Bora lá! \o/

    ResponderExcluir
  2. Morreu... a maioria dos sites usam URL amigável sem uma identificação numérica.. desse modo não tem como eu fazer o loop para pegar as últimas notícias...

    é.. acho que vou fazer uma funcionalidade para agendar os posts do painel para o usuário cadastrar a notícia e quando chegar a hora agendada o post vai ao ar.

    ResponderExcluir