Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Make PDFs searchable #71

Open
HaraldCaap opened this issue Sep 2, 2024 · 0 comments
Open

Make PDFs searchable #71

HaraldCaap opened this issue Sep 2, 2024 · 0 comments
Assignees

Comments

@HaraldCaap
Copy link
Contributor

HaraldCaap commented Sep 2, 2024

En bra feature vore att kunna söka i PDF:er så som styrdokument och så vidare för att hitta den information som medlemmarna letar efter.

När en användare utför en sökning ska systemet returnera relevanta filer och de textavsnitt som matchar söktermen.

Ish planen:

1.	Extrahera text från PDF-filer med PyPDF2 eller pdfminer.six.
2.	Indexera den extraherade texten med Whoosh för effektiv sökning.
3.	Skapa en API-endpoint med FastAPI som hanterar sökfrågor.
4.	Skriv enhetstester för att verifiera sökfunktionaliteten.
5.	Implementera en rutin för att hålla sökindexet uppdaterat.
@HaraldCaap HaraldCaap self-assigned this Sep 2, 2024
@cat2code cat2code self-assigned this Sep 16, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants