main.py


from flask import Flask, request, jsonify, render_template
from flask_cors import cross_origin

app = Flask(__name__)

# Hello API for testing purposes
@app.route('/hello', methods=['GET'])
@cross_origin()
def hello_api():
  print ('Hello World Flask API')
  response = jsonify({'message': 'Hello from Query-Doc'})
  return response


# render landing page for uploading file and querying
@app.route('/')   
def main():   
  return render_template('index.html')  



# Upload PDF API
@app.route('/uploadpdf', methods=['POST'])
@cross_origin()
def uploadpdf():
  f = request.files['file'] 
  f.save(f.filename) 
  from indexify import IndexifyClient
  client = IndexifyClient()
  client.add_extraction_policy(extractor='tensorlake/pdf-extractor', name="pdf-extraction")
  client.add_extraction_policy(extractor='tensorlake/chunk-extractor', name="chunks", content_source="pdf-extraction", input_params={"chunk_size": 512, "overlap": 150})
  client.add_extraction_policy(extractor='tensorlake/minilm-l6', name="minilm-em", content_source="chunks")

  client.upload_file(path="f.filename")
  return jsonify({'message': 'uploaded'})



# Query PDF API
@app.route('/querypdf', methods=['POST'])
@cross_origin()
def querypdf():
  question_asked = request.form.get("query")
  from indexify import IndexifyClient
  client = IndexifyClient()

  from indexify_langchain import IndexifyRetriever
  params = {"name": "minilm-em.embedding", "top_k": 15}
  retriever = IndexifyRetriever(client=client, params=params)

  from langchain_core.output_parsers import StrOutputParser
  from langchain_core.prompts import ChatPromptTemplate
  from langchain_core.runnables import RunnablePassthrough
  # from langchain_openai import ChatOpenAI
  from langchain_google_vertexai import ChatVertexAI

  template = """Answer the question based only on the following context:
  {context}

  Question: {question}
  """
  prompt = ChatPromptTemplate.from_template(template)

  # model = ChatOpenAI(openai_api_key="<OpenAI API Key Goes Here>")
  model = ChatVertexAI()


  chain = (
      {"context": retriever, "question": RunnablePassthrough()}
      | prompt
      | model
      | StrOutputParser()
  )

  response = jsonify({'result': chain.invoke(question_asked)})
  return response




if __name__ == "__main__":
  app.run(debug=False, host="0.0.0.0", port=8080)