Find Jobs
Hire Freelancers

Speedy high volume web page scraper

$750-1500 USD

Fermé
Publié il y a presque 13 ans

$750-1500 USD

Payé lors de la livraison
I have a software product that reads online text and creates a detailed profile (a profile is then compared to other profiles and recommendations can then be served). The profiling engine is a single-server Java application that is served off Tomcat. It has a REST API. Up till now, the profiles have reached my server via full text RSS feeds, or XML files (that I then create a custom parser for in Java). I now have a project where I will receive a high volume of urls (around 80,000 arriving during the course of the day) and will need to 'scrape' the text off these pages before passing this to the profiling engine. For this development operational speed is very important and so the 'scraper' needs to be fast acting in order to handle the perceived transaction volume but also accurate enough so that most of the page 'junk' does not affect adversely the profile that is made. Ideally the web scraper will take the page 'title' and 'article' text and use these for profiling. However, there will not be a standard format for these pages and so the web scraper needs to be fairly generic too. Get in contact if you feel you can achieve this but please you must have experience in this field!!
N° de projet : 1010422

Concernant le projet

11 propositions
Projet à distance
Actif à il y a 13 ans

Cherchez-vous à gagner de l'argent ?

Avantages de faire une offre sur Freelancer

Fixez votre budget et vos délais
Soyez payé pour votre travail
Surlignez votre proposition
Il est gratuit de s'inscrire et de faire des offres sur des travaux
11 freelances proposent en moyenne $1 095 USD pour ce travail
Avatar de l'utilisateur
Hello, Please check your inbox Thanks
$1 380 USD en 15 jours
4,9 (112 commentaires)
7,4
7,4
Avatar de l'utilisateur
$750 USD en 5 jours
4,9 (48 commentaires)
6,3
6,3
Avatar de l'utilisateur
Hello, we have a great experience in web scraping. A detailed experience information will be sent as PM. We can handle between 100-150K web sources (URLs) per day (have few servers doing this for years). Looking forward to hear from you! Regards Peter Long
$960 USD en 25 jours
5,0 (2 commentaires)
5,8
5,8
Avatar de l'utilisateur
Please check PMB
$1 200 USD en 15 jours
4,8 (10 commentaires)
5,6
5,6
Avatar de l'utilisateur
Hello Please check pmb
$1 500 USD en 12 jours
5,0 (1 commentaire)
4,5
4,5
Avatar de l'utilisateur
can we discuss Reffer to pmb
$750 USD en 7 jours
4,9 (9 commentaires)
3,6
3,6
Avatar de l'utilisateur
I can help you really quickly! Check your inbox.
$750 USD en 3 jours
5,0 (3 commentaires)
3,5
3,5
Avatar de l'utilisateur
see PM for details
$1 500 USD en 20 jours
5,0 (6 commentaires)
3,5
3,5
Avatar de l'utilisateur
please see pm
$800 USD en 20 jours
0,0 (0 commentaires)
0,0
0,0
Avatar de l'utilisateur
I have long experience in J2EE and I have done many scrapers in java using htmlunit or jakarta commons.
$1 000 USD en 10 jours
0,0 (0 commentaires)
0,0
0,0

À propos du client

Drapeau de UNITED KINGDOM
London, United Kingdom
0,0
0
Membre depuis avr. 4, 2011

Vérification du client

Merci ! Nous vous avons envoyé un lien par e-mail afin de réclamer votre crédit gratuit.
Une erreur a eu lieu lors de l'envoi de votre e-mail. Veuillez réessayer.
Utilisateurs enregistrés Total des travaux publiés
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Chargement de l'aperçu
Permission donnée pour la géolocalisation.
Votre session de connexion a expiré et vous avez été déconnecté. Veuillez vous connecter à nouveau.