Nếu đội ngũ phát triển nói rằng trọng tâm lớn tiếp theo của chúng ta sẽ là khai thác suy diễn LLM—sử dụng GPU NVIDIA RTX hoặc AMD để thực hiện suy diễn LLM và kết nối chúng với các nền tảng như OpenRouter để bán khả năng tính toán—thì mọi người có quan tâm không?