Multimodal architecture for video captioning with memory networks and an attention mechanism - Concepedia

Concepedia

Publication | Closed Access

Multimodal architecture for video captioning with memory networks and an attention mechanism

40

Citations

35

References

2017

Year

Wei Li, Dashan Guo, Xiangzhong Fang

Pattern Recognition Letters

Artificial IntelligenceNatural Language ProcessingMultimodal LlmEngineeringMachine LearningMemory NetworksVision Language ModelVideo SummarizationVisual Question AnsweringAttention MechanismDeep LearningMultimodal ArchitectureComputer VisionMachine TranslationMulti-modal Summarization

References

	Year	Citations

Page 1

Page 1