Prime_Questions: #RAG

#RAG

Key Concepts

S.No	Topic	Sub-Topics
1	RAG	What is RAG, Why RAG, RAG vs LLM-only, RAG use cases, RAG limitations
2	LLM Fundamentals for RAG	Transformer basics, Context window, Tokens, Prompt-response flow, Hallucinations
3	Text Embeddings	What are embeddings, Vector representation, Embedding models, Dimensionality, Similarity meaning
4	Embedding Models	OpenAI embeddings, SentenceTransformers, Multilingual embeddings, Trade-offs, Model selection
5	Vector Databases Basics	Vector DB concept, ANN search, Indexing basics, Metadata storage, Vector lifecycle
6	Vector DB Tools	FAISS, Pinecone, Weaviate, Milvus, ChromaDB
7	Distance Metrics	Cosine similarity, Dot product, Euclidean distance, Trade-offs, Metric selection
8	Chunking Strategies	Fixed chunking, Semantic chunking, Chunk size, Overlap, Parent-child chunks
9	Document Ingestion	PDF ingestion, Text files, HTML ingestion, Cleaning text, Normalization
10	Indexing Pipeline	Embedding generation, Batch indexing, Metadata tagging, Versioning, Index updates
11	Retrieval Basics	Top-k retrieval, Similarity threshold, Recall vs precision, Retrieval latency, Query flow
12	Hybrid Search	Dense search, Sparse search, Keyword search, BM25, Hybrid ranking
13	Metadata Filtering	Structured filters, Access control, User-based filtering, Time filters, Security filters
14	Prompt Engineering for RAG	Prompt templates, Context injection, Instructions, Citations, Answer formatting
15	Naive RAG Architecture	Single retriever, Single prompt, Context stuffing, Limitations, Failure cases
16	Advanced RAG Architecture	Multi-retriever, Reranking, Compression, Query rewriting, Modular design
17	Reranking Techniques	Cross-encoders, Relevance scoring, Latency trade-off, Top-n rerank, Quality boost
18	Context Optimization	Token limits, Context pruning, Compression, Redundancy removal, Ordering chunks
19	Multi-hop Retrieval	Complex queries, Query decomposition, Iterative retrieval, Chain-of-thought, Examples
20	Agentic RAG	LLM agents, Tool calling, Planner-executor, Memory, Autonomous retrieval
21	Structured Data RAG	SQL integration, CSV data, APIs, Knowledge graphs, Hybrid retrieval
22	RAG with LangChain	Retrievers, Chains, Vector stores, Memory, RAG pipelines
23	RAG with LlamaIndex	Indexes, Query engines, Node parsing, Storage context, Tools
24	Evaluation of RAG	Retrieval metrics, Answer quality, Faithfulness, Relevance, Latency
25	RAGAS Framework	Faithfulness score, Context recall, Answer relevance, Ground truth, Automation
26	Security in RAG	Prompt injection, Data leakage, RBAC, PII handling, Secure retrieval
27	Scalability & Performance	Index sharding, Caching, Async retrieval, Load balancing, Cost control
28	Production Deployment	API design, Model hosting, Vector DB hosting, Monitoring, Logging
29	Monitoring & Feedback	User feedback, Drift detection, Retrieval errors, Continuous improvement, Alerts
30	Enterprise RAG Use Cases	Chatbots, Search engines, Knowledge assistants, Analytics, Decision support

Interview question

Basic Level

What is Retrieval-Augmented Generation (RAG)?
Why is RAG needed for LLM applications?
What problems does RAG solve?
What are the core components of a RAG system?
What is retrieval in RAG?
What is generation in RAG?
How is RAG different from fine-tuning?
How is RAG different from prompt engineering?
What is a knowledge base in RAG?
What type of data can RAG consume?
What are embeddings?
Why are embeddings used in RAG?
What is a vector database?
Examples of vector databases?
What is semantic search?
What is similarity search?
What distance metrics are commonly used?
What is cosine similarity?
What is text chunking?
Why is chunking important in RAG?
What is context window?
What is prompt grounding?
What is hallucination in LLMs?
How does RAG reduce hallucinations?
What are common RAG use cases?

Intermediate Level

Explain the end-to-end RAG workflow.
How are embeddings generated?
Which embedding models are commonly used?
What is embedding dimensionality?
How does chunk size affect retrieval?
What is chunk overlap?
What is metadata filtering?
What is hybrid search?
Difference between sparse and dense retrieval?
What is keyword search vs vector search?
What is top-k retrieval?
How do you decide the value of k?
What is reranking?
Why is reranking important?
What is prompt templating in RAG?
How is retrieved context injected into prompts?
What is latency challenge in RAG?
How do you improve RAG response speed?
What is document indexing?
How do you update knowledge base data?
What is FAISS?
What is Pinecone?
What is Weaviate?
What is Chroma DB?
What role does LangChain play in RAG?

Advanced Level

What are different RAG architectures?
What is naive RAG?
What is advanced RAG?
What is agentic RAG?
What is multi-hop retrieval?
What is query rewriting?
What is a self-query retriever?
What is parent-child chunking?
Difference between document-level and chunk-level retrieval?
What is contextual compression?
How do you handle long documents in RAG?
How does RAG integrate with structured data?
How can SQL databases be used in RAG?
What is retrieval evaluation?
What metrics are used to evaluate RAG?
What is recall vs precision in RAG?
What is MMR (Max Marginal Relevance)?
How does MMR help improve answer quality?
What is data skew in retrieval?
How do you handle stale data?
How do you implement real-time RAG?
How is access control handled in RAG?
How do you secure sensitive documents?
How does multilingual RAG work?
What are common RAG failure patterns?

Expert Level

How do you design a production-grade RAG system?
How does RAG scale to millions of documents?
What are trade-offs between RAG and fine-tuning?
How do you optimize RAG for low latency?
How do you debug poor RAG responses?
What causes irrelevant retrieval?
How do you improve retrieval accuracy?
How do context limits impact RAG?
What strategies help reduce token usage?
How do you prevent prompt injection in RAG?
How do you measure answer faithfulness?
What is RAGAS evaluation framework?
How do you monitor RAG systems in production?
How do you build feedback loops?
What is continuous indexing?
How do you version embeddings?
How do you migrate vector databases safely?
How do you control RAG operational costs?
How do you handle LLM model upgrades?
How does RAG enable explainability?
What is citation-based RAG?
How does RAG work with AI agents?
What are emerging RAG patterns?
What are the limitations of RAG?
Explain enterprise-level RAG use cases.

Prime_Questions

Popular Posts

09 January 2026

#RAG

Key Concepts

Interview question

Basic Level

Intermediate Level

Advanced Level

Expert Level

Related Topics