Find Jobs
Hire Freelancers

Convert PDF and Microsoft Word document to JSON using python 2.6

$250-750 USD

Fechado
Publicado há quase 8 anos

$250-750 USD

Pago na entrega
I have several hundred resumes in PDF and Microsoft Word format. I want a python script that is capable of extracting the data from these file formats and generating a JSON document containing the resume content. The JSON that is generated should adhere to the standards defined here: [login to view URL] I have included 2 sample files, but will provide a much larger set of test resumes to be used in the development effort. The script should include automated testing (check the resulting JSON matches the manually created JSON document for the corresponding PDF/Word document).
ID do Projeto: 10289742

Sobre o projeto

9 propostas
Projeto remoto
Ativo há 8 anos

Quer ganhar algum dinheiro?

Benefícios de ofertar no Freelancer

Defina seu orçamento e seu prazo
Seja pago pelo seu trabalho
Descreva sua proposta
É grátis para se inscrever e fazer ofertas em trabalhos
9 freelancers estão ofertando em média $545 USD for esse trabalho
Avatar do Usuário
Hello, My proposal is for windows app using .Net. I have experienced in read the doc and PDF using open source libraries in C# such as openxml . If you are interested, please let me know. I'm looking some more samples. Thanks, Sheik
$474 USD em 10 dias
4,9 (46 avaliações)
5,8
5,8
Avatar do Usuário
Good at python/pdf/doc processing, and your project looks OK for me at first glance. Please contact me to discuss more detailed requirement, Thanks
$500 USD em 7 dias
4,9 (32 avaliações)
5,4
5,4
Avatar do Usuário
Hi Boss, Issue: extract resume I will analyst good algorithm for extract resume. In my experience, some algorithm is good for analyst data if the algorithm have threshold value and we can define that value. Because one algorithm good for some pattern but not good for other pattern. We can't limit the pattern in this world, that's why we need threshold. scope: input: 1. *doc & *pdf 2. document should be readable and content is text, not image out of scope: 1. no OCR process Thanks, catbig
$745 USD em 15 dias
5,0 (10 avaliações)
4,1
4,1
Avatar do Usuário
I have recently started to work as a freelancer. However, I do believe I will be one of the most appropriate candidate for this project. Being a lead developer in a medium to large commercial software dev team for over several years, I can assure you that the project will be delivered on time meeting the set requirements. Having great experience with data handling/analytics, writing various ETL processes and writing multiple custom language parsers, the quality of the code that you get will be at its highest possible standard.
$555 USD em 5 dias
0,0 (0 avaliações)
0,0
0,0

Sobre o cliente

Bandeira do(a) UNITED STATES
Dupo, United States
5,0
8
Método de pagamento verificado
Membro desde jan. 23, 2006

Verificação do Cliente

Obrigado! Te enviamos um link por e-mail para que você possa reivindicar seu crédito gratuito.
Algo deu errado ao enviar seu e-mail. Por favor, tente novamente.
Usuários Registrados Total de Trabalhos Publicados
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Carregando pré-visualização
Permissão concedida para Geolocalização.
Sua sessão expirou e você foi desconectado. Por favor, faça login novamente.