Hola, estoy creando un sitio y en la parte de publicar las noticias me he topado con que las keywords de las noticias son extraidas del contenido y del titulo de la noticia. Por lo que me he propuesto la idea de cuando se ecriba una notica en mi pagina en php que a la hora de insertarla en el server se le haga un analisis a la noticia y de esta se saque las meta keywords que mejor referenciaran al usuario y al buscador sobre el contenido de la noticia para un mejor posicionamiento en los buscadores.
He pensado utilizar mineria de datos y otros algoritmos pero me pregunto que si ya existe algo como esto ya que solo llevo un año con internet y ustedes todo una vida ;). Saludos y me gustaría que me pusieran sugerencias de como hacerlo. disculpen la molestia, slaudos D
entre Desarrolladores
Recibe ayuda de expertos
Registrate y pregunta
Es gratis y fácil
Recibe respuestas
Respuestas, votos y comentarios
Vota y selecciona respuestas
Recibe puntos, vota y da la solución
Pregunta
Como sacar las Keywords de una Noticia
- preguntó
- Web
- 722 Vistas
- 2 Respuestas
- solucionada
2 Respuestas
Hola Dairon, soy parte del equipo de MonkeyLearn. Muy pronto estaremos lanzando una nueva familia de módulos de "extracción" para realizar extracción de keywords, extracción de entidades, entre otras cosas. Pienso que esto podría serte de utilidad. Estas nuevas features van a estar disponible en 1-2 semanas aproximadamente para todos los usuarios de MonkeyLearn. Si lo deseas, puedes escribirme a [email protected] así te aviso cuando las tengamos en producción. Cualquier pregunta o comentario, no dudes en contactarme. Saludos, Federico.
Por favor, accede o regístrate para añadir un comentario.
Hola Dairon,
no estoy seguro de que exista un algoritmo para hallar palabras clave de un texto. Por el mismo motivo que no existen algoritmos para traducción automática: el habla humana no es (por ahora) un problema computable.
Para estas cosas se recurren a aproximaciones más o menos atinadas (el resultado se ve en los traductores!) que se pueden aplicar.
Para noticias es de los casos más simples, porque el estilo periodístico manda que el primer párrafo sea un resumen de la noticia completa. Para esto, podrías quedarte con todos los sustantivos del primer párrafo... y para hallas los sustantivos, podrías usar el listado en "words" de un servidor GNU/Linux o recurrir a los diccionarios del sistema (como aspell) para que te procesen palabras.
Es un problema interesante: cuantos más recursos le puedas dar para desarrollarla, mejor precision tendrá.
Los sitios de noticias tienen una sección de palabras clave que pone el autor del artículo... es muy raro que esto sea un proceso automático, porque estos procesos a veces ponen burradas.
Saludos!
Por favor, accede o regístrate para añadir un comentario.
Por favor, accede o regístrate para responder a esta pregunta.
En el blog
-
- 676981
- 1
- Jul 5, 2015
Sin Respuesta
-
- 64
- 0
- Oct 18
-
- 156
- 0
- Jul 9
-
- 515
- 1
- Mar 19
-
- 385
- 2
- Feb 26
-
- 4586
- 0
- Nov 7, 2023
-
- 473
- 0
- Sep 19, 2023
-
- 452
- 0
- Ago 21, 2023
-
- 632
- 0
- May 14, 2023
- ver todas
Actividad Reciente
alyvrs preguntó Oct 19
Ayuda , necesito mostrar datos creados solo por el…ManHol preguntó Jul 9
pasar un archivo de excel a csv en pythonArtEze respondió Abr 24
Alguien sabe, no me ignorenArtEze seleccionó una respuesta Abr 24
Bajar extensión de Chrome sin actualizar el navega…ArtEze respondió Abr 24
Bajar extensión de Chrome sin actualizar el navega…ArtEze preguntó Abr 24
Bajar extensión de Chrome sin actualizar el navega…ArtEze respondió Abr 24
No me deja instalar OracleArtEze respondió Abr 24
Formulario que guarde los datos de un jsonArtEze comentó Abr 24
Script /boot/ scrapingSantiago2610 comentó Mar 23
Acualizar ChoiceField en django
Ultimas Preguntas
Usuarios Top
- Leonardo-Tadei
- 227320 Puntos
- Peter
- 150480 Puntos
- white
- 75880 Puntos
- carlossevi
- 63580 Puntos
- magarzon
- 30650 Puntos
- pregunton
- 20400 Puntos