entre Desarrolladores

Recibe ayuda de expertos

Registrate y pregunta

Es gratis y fácil

Recibe respuestas

Respuestas, votos y comentarios

Vota y selecciona respuestas

Recibe puntos, vota y da la solución

Pregunta

2votos

Como sacar las Keywords de una Noticia

Hola, estoy creando un sitio y en la parte de publicar las noticias me he topado con que las keywords de las noticias son extraidas del contenido y del titulo de la noticia. Por lo que me he propuesto la idea de cuando se ecriba una notica en mi pagina en php que a la hora de insertarla en el server se le haga un analisis a la noticia y de esta se saque las meta keywords que mejor referenciaran al usuario y al buscador sobre el contenido de la noticia para un mejor posicionamiento en los buscadores.
He pensado utilizar mineria de datos y otros algoritmos pero me pregunto que si ya existe algo como esto ya que solo llevo un año con internet y ustedes todo una vida ;). Saludos y me gustaría que me pusieran sugerencias de como hacerlo. disculpen la molestia, slaudos D

2 Respuestas

0voto

fecotryo Puntos450

Hola Dairon, soy parte del equipo de MonkeyLearn. Muy pronto estaremos lanzando una nueva familia de módulos de "extracción" para realizar extracción de keywords, extracción de entidades, entre otras cosas. Pienso que esto podría serte de utilidad. Estas nuevas features van a estar disponible en 1-2 semanas aproximadamente para todos los usuarios de MonkeyLearn. Si lo deseas, puedes escribirme a [email protected] así te aviso cuando las tengamos en producción. Cualquier pregunta o comentario, no dudes en contactarme. Saludos, Federico.

0voto

dairon comentado

Buenos Días, primero que todo les doy las gracias a los creadores de entredesarrolladores ya que gracias a este lugar en la web he aprendido mucho y seguiré aprendiendo, nunca pense que me podría poner en contacto con profecionales del developer y algún día ser uno más entre ellos, me falta mucho por aprender pero sigo aprendiendo, por primera vez tengo internet y tengo la oportunidad de aprender de verdad y no pienso dejar pasar la oportunidad. Disculpen que no sea un comentario de Desarrollo pero siempre he amado la infórmatica y comencé a aprenderla con 12 años con el QBasic en Teclados inteligente en televisores Crin218 Rusos, luego Pascal, Delphi5, ... pero este año es que he podido tener internet en mi trabajo y ahora tengo 27 años, espero aún estar a tiempo para aprender y alcanzar a los maestros.
Saludos Dairon

0voto

dairon comentado

Este es el Link Sacar Keywords de prueba que monté que me saca las keywords de una noticia y funciona muy bien gracias al proyecto de MonkeyLearn y en especial a fecotryo por ayudarme con la API, utiliza la Inteligencia Artifical de los muchachos de MonkeyLearn se los recomiendo es sencillo de implementar, le pondré otras cositas luego cuando ya lo valla a incluir en mi backend para publicar noticias, pues cada keywords devuelta por MonkeyLearn viene con su average y se me ocurrieron unas cuantas ideas.

0voto

Leonardo-Tadei Puntos227320

Hola Dairon,

no estoy seguro de que exista un algoritmo para hallar palabras clave de un texto. Por el mismo motivo que no existen algoritmos para traducción automática: el habla humana no es (por ahora) un problema computable.

Para estas cosas se recurren a aproximaciones más o menos atinadas (el resultado se ve en los traductores!) que se pueden aplicar.

Para noticias es de los casos más simples, porque el estilo periodístico manda que el primer párrafo sea un resumen de la noticia completa. Para esto, podrías quedarte con todos los sustantivos del primer párrafo... y para hallas los sustantivos, podrías usar el listado en "words" de un servidor GNU/Linux o recurrir a los diccionarios del sistema (como aspell) para que te procesen palabras.

Es un problema interesante: cuantos más recursos le puedas dar para desarrollarla, mejor precision tendrá.

Los sitios de noticias tienen una sección de palabras clave que pone el autor del artículo... es muy raro que esto sea un proceso automático, porque estos procesos a veces ponen burradas.

Saludos!

0voto

dairon comentado

yo tengo en la base de datos hasta este momento 40687 noticias podría crear un algoritmo de Intelgencia artificial con mineria de datos usando el titulo, descripcion para desarrollarle la inteligencia en patrones de comportamiento para la extraccion de las keywords ?? para que trabaje tal como google quiere que sean las keywords de las páginas ya que ellos actualizan sus algoritmos de posicionamiento y de seleccion de palabras claves ya mas que palabras son fraces tambien. crees que se puede hacer con eso mira este sitio que lo pienzo usar http://www.monkeylearn.com/

Por favor, accede o regístrate para responder a esta pregunta.

Otras Preguntas y Respuestas


...

Bienvenido a entre Desarrolladores, donde puedes realizar preguntas y recibir respuestas de otros miembros de la comunidad.

Conecta