Find Jobs
Hire Freelancers

Special-use spider

$100-500 USD

Închis
Data postării: peste 21 ani în urmă

$100-500 USD

Plata la predare
We need a set of functions to explore a small website from a given starting URL, and return the following information: a) an array of all the external links (i.e. links outside the starting directory, or to a different host). $externalLinks[$URL]=$numberOfOccurrences b) a count of all the images linked to from a site c) the size of the smallest image linked from the site d) an array of all the page URLs which comprise the site, along with some identifying feature that can be used to identify if they change. I suggest using an MD5 hash of the HTML of a page, and returning an array like $sitePages[$pageURL]=$md5hash e) a flag indicating whether the site uses Javascript anywhere in it f) a flag indicating whether the site has any (Javascript) popups g) an array containing any of a list of 'banned words' that are found within the site (list will be provided). The functions will eventually be integrated as methods of a larger class. Features & notes: The code should deal appropriately with pages containing frames The code should take as parameters a) the maximum total number of pages to crawl (likely to be ~10-15) b) the maximum 'depth' to explore (likely to be ~3-5) A 'website' can be defined as any pages linked to from the starting page, within the initial directory structure. So for a starting address of [login to view URL], [login to view URL] would be considered part of the site, but [login to view URL] would be considered an external link, as would a link to [login to view URL] You will have access to a mysql database, if required. I would prefer you not to create temporary files on the filesystem, but am happy to listen to any pressing need for them. You may use a third-party crawler program to assist, if necessary. For instance, you may want to use the FreeBSD port of crawl. Please let me know if you have comments or questions. ## Deliverables 1) Complete and fully-functional working program(s) as well as complete source code of all work done. 2) Complete ownership and distribution copyrights to all work purchased. Completion: I will provide several sample sites for you to work with; the project will be deemed complete if it successfully reports on several other (similar) test sites. Other criteria include clean, well-structured code, and some commenting of it :-) Please let me know if you have comments or questions. ## Platform FreeBSD 4.6 Apache 1.3 PHP Version 4.2 MySQL 4
ID-ul proiectului: 2889436

Despre proiect

9 propuneri
Proiect la distanță
Activ: 21 ani în urmă

Vrei să câștigi bani?

Avantajele de a licita pe platforma Freelancer

Stabilește bugetul și intervalul temporal
Îți primești plata pentru serviciile prestate
Evidențiază-ți propunerea
Te înregistrezi și licitezi gratuit pentru proiecte
9 freelanceri plasează o ofertă medie de $242 USD pentru proiect
Avatarul utilizatorului
See private message.
$153 USD în 14 zile
5,0 (620 recenzii)
7,7
7,7
Avatarul utilizatorului
See private message.
$115,60 USD în 14 zile
5,0 (64 recenzii)
5,5
5,5
Avatarul utilizatorului
See private message.
$335,75 USD în 14 zile
5,0 (9 recenzii)
5,2
5,2
Avatarul utilizatorului
See private message.
$340 USD în 14 zile
4,5 (24 recenzii)
4,0
4,0
Avatarul utilizatorului
See private message.
$85 USD în 14 zile
5,0 (10 recenzii)
3,1
3,1
Avatarul utilizatorului
See private message.
$340 USD în 14 zile
5,0 (1 recenzie)
0,3
0,3
Avatarul utilizatorului
See private message.
$552,50 USD în 14 zile
0,0 (0 recenzii)
0,0
0,0
Avatarul utilizatorului
See private message.
$127,50 USD în 14 zile
0,0 (0 recenzii)
0,0
0,0
Avatarul utilizatorului
See private message.
$127,50 USD în 14 zile
0,0 (0 recenzii)
0,0
0,0

Despre client

Steagul ANGUILLA
Anguilla
0,0
0
Membru din dec. 4, 2002

Verificarea clientului

Mulțumim! Ți-am trimis prin e-mail linkul pe care trebuie să-l accesezi pentru a revendica creditul gratuit.
A apărut o eroare la trimiterea e-mailului. Încearcă din nou.
Utilizatori înregistrați Totalul proiectelor postate
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Se încarcă previzualizarea
S-a oferit permisiunea de depistare a locației.
Ți-a expirat sesiunea pentru conectare sau te-ai deconectat. Conectează-te din nou.