Sergio Sola - Nuevas tecnologías

miércoles, febrero 08, 2006

Blog Data Mining

The most difficult of the project (mirablog) is the process toinformation extract. For this project is necessary toextract great quantity of data from a different files, andto save in the data base correctly.


How?


The web-crawler will need to open a RSS file, and analyzethe XML tags, to extract the interesting data, this processwould have than to be fast.


For example, to open the RSS file of WebLogs.com with thenew actualized blogs, this file is big, and it has muchdata. With the data of this file, the spider will enter inthe real page of the blog post, and to save entire cache(with html) and a text-cache (only text). This process wouldhave to be very fast, that every minute this file change.


Now, we have the data in the data base, but, how we orderthis data? We need a rank, the “BlogRank”, how we may tocalculate this rank?, I had thought to count relationallinks, similar to BlogRank, to give more importance a linkedblogs. Is a base idea. And I am open to receive suggestions.

Reapertura del blog

Pues eso, ayer me puse a pensar, leches, tengo un buscador con decenas de miles de blogs, ¿y yo no tengo uno?, pues sí que tenía, éste, hace tiempo, pero más abandonado que... joder, imagínense lo que les apetezca.

¿Qué escribiré aquí? Pues lo que me pase por la cabeza, en castellano y inglés (juas!) así práctico lo poco que sé... Do you know?

Ale, ya iré poniendo cosas, a ver sí me leen más que dos porciones de pizza rancias.

domingo, septiembre 26, 2004

Programando en C

Dejo a vuestra disposición algunos de mis algorismos en C, son de los primeros que he realizado, espero que os sea útil en sistema de tutorial.

  1. Devuelve sí es par o no, el número introducido.
#include stdio.h
#include conio.h

main()
{

int num=0;
int i=0;
double div=0;
double divisor=2;
int n=0;
double res=0;

for (i=0;i>=100;i++) { //Bucle para realizar las divisones succesivas.

printf("\n\t\t\t****************************\n");
printf("\t\t\t******* PAR O IMPAR? *******\n");
printf("\t\t\t****************************\n\n");
printf("\t\t\tIntrodueix un num:.... ");
scanf("%d",&num);

div=num/divisor;
n=(int)div;
res=div-n; //Con ésta fórmula devuelve 0 sí el número es par.
printf("\t\t\t----------------------------\n\n");
if (res==0) // Condición para encontrar sí el resultado de res es 0 o no.
{
printf("\t\t\t****************************\n");
printf("\t\t\t******* ES PAR *******\n");
printf("\t\t\t****************************\n\n\n");
printf("\t\t---Gracies per utilitzar aquest programa---\n");
}
else {
printf("\t\t\t****************************\n");
printf("\t\t\t******* ES IMPAR *******\n");
printf("\t\t\t****************************\n\n\n");
printf("\t\t---Gracies per utilitzar aquest programa---\n");
}
}

getch();
}
Espero que os sea de utilidad, cada día iré incluyendo algunos algorismos, para que puedas tener ejemplos con los que practicar.



Experimentando con Python

LLevo un tiempo experimentando con algunos lenguajes de programación, como C o Java (de ellos hablaré otro día). Llevo un par de días probando con un lenguaje que desde un inicio me pareció simpático Python, es un lenguaje que comparado con otros (como C), es muchos más sencillo, por:

  1. Cuando se declara un valor (Ej. en C: int i = 2;) en Python no es necesario declarar el tipo de variable, simplemente i = 2.
Ej Suma.

>>> a = 2
>>> b = 3
>>> print 2+b
>>> 4

Como podéis ver, además, no es necesario poner punto y coma ';', como en C y Java, para la finalización de cada sentencia.

Como en C, cuando se trabaja con strigs, se debe encomillas:

>>> print "Hola"
>>> Hola

Declarar variables o arrays es realmente sencillo:

>>> palabras = "Hola"
>>> array = ("Hola","Adios")
>>> print palabras
>>> Hola
>>> print array[1]
>>> Adios

Es realmente sencillo y rápido trabajar con él, más adelante os iré explicando mis experiencias con éste lenguaje, de momento es puedo decir que accedáis a www.python.org, para descargaros el programario necesario.

Sobre su potencia y usabilidad no puedo hablar demasiado, ya que no lo he usado mucho aún, sólo puedo decir que me parece un lenguaje muy interesante. Grandes compañías tecnológicas como Google, está en su plantel de lenguajes, para la realización de sus productos.


>