ಓಪನ್ ಮಾದರಿ ರೇಸ್ನಲ್ಲಿ ಹೊಸ ಸ್ಪರ್ಧಿ
Alibaba ತನ್ನ ಇತ್ತೀಚಿನ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮಾದರಿಗಳ ಕುಟುಂಬ, Qwen 3.5 ಸರಣಿಯನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ, ಇದು ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಗಳ ಕ್ಷೇತ್ರದಲ್ಲಿ ಪ್ರಾಬಲ್ಯಕ್ಕಾಗಿ ಜಾಗತಿಕ ಸ್ಪರ್ಧೆಯನ್ನು ತೀವ್ರಗೊಳಿಸಿದೆ. ಈ ಬಿಡುಗಡೆಯು ನಾಲ್ಕು ವಿಭಿನ್ನ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, ಮತ್ತು Qwen3.5-27B — ಪ್ರತಿಯೊಂದೂ ವಿಭಿನ್ನ ಬಳಕೆಯ ಸಂದರ್ಭಗಳು ಮತ್ತು ಕಂಪ್ಯೂಟೇಶನಲ್ ಬಜೆಟ್ಗಳನ್ನು ಗುರಿಯಾಗಿಸಿಕೊಂಡಿದೆ, ಆದರೆ ದಕ್ಷತೆ ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಸಾಮಾನ್ಯ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತದೆ.
ಚೀನಾದ ಟೆಕ್ ದೈತ್ಯ Qwen 3.5 ಅನ್ನು ಪ್ರಸ್ತುತ ಲಭ್ಯವಿರುವ ಅತ್ಯಂತ ಸಮರ್ಥ ವಾಣಿಜ್ಯ ಮಾದರಿಗಳಲ್ಲಿ, ವಿಶೇಷವಾಗಿ OpenAI ನ GPT-5 mini ಮತ್ತು Anthropic ನ Claude Sonnet 4.5 ಗೆ ನೇರ ಸ್ಪರ್ಧಿಯಾಗಿ ಸ್ಥಾನ ನೀಡುತ್ತಿದೆ. ಕಾರ್ಯಕ್ಷಮತೆಯ ಹಕ್ಕುಗಳಷ್ಟೇ ಅಲ್ಲ, ಬೆಲೆಯೂ ಈ ಸವಾಲನ್ನು ವಿಶೇಷವಾಗಿ ಆಕರ್ಷಕವಾಗಿಸುತ್ತದೆ: Alibaba ಹೇಳುವಂತೆ ಅವರ ಮಾದರಿಗಳು ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಹೋಲಿಸಬಹುದಾದ ಗುಣಮಟ್ಟವನ್ನು ನೀಡುತ್ತವೆ, ಇದು ಉನ್ನತ-ಮಟ್ಟದ AI ಸಾಮರ್ಥ್ಯಗಳನ್ನು ವ್ಯಾಪಕ ಶ್ರೇಣಿಯ ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಉದ್ಯಮಗಳಿಗೆ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡುತ್ತದೆ.
ಮಾದರಿ ಶ್ರೇಣಿ
Qwen 3.5 ಕುಟುಂಬವು ಮಾದರಿ ವಿನ್ಯಾಸಕ್ಕೆ ಶ್ರೇಣೀಕೃತ ವಿಧಾನವನ್ನು ಅಳವಡಿಸಿಕೊಂಡಿದೆ, ಇದು ಅಲ್ಟ್ರಾ-ಲಘು ಇನ್ಫರೆನ್ಸ್ನಿಂದ ಭಾರೀ ತಾರ್ಕಿಕ ಕಾರ್ಯಗಳವರೆಗೆ ಆಯ್ಕೆಗಳನ್ನು ನೀಡುತ್ತದೆ. ಹೆಸರಿಸುವ ಸಂಪ್ರದಾಯವು ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ: "A" ನಿಂದ ಬೇರ್ಪಡಿಸಲಾದ ಎರಡು ಸಂಖ್ಯೆಗಳನ್ನು ಹೊಂದಿರುವ ಮಾದರಿಗಳು ಮಿಕ್ಸ್ಚರ್-ಆಫ್-ಎಕ್ಸ್ಪರ್ಟ್ಸ್ (MoE) ವಿಧಾನವನ್ನು ಬಳಸುತ್ತವೆ, ಅಲ್ಲಿ ಯಾವುದೇ ನಿರ್ದಿಷ್ಟ ಇನ್ಪುಟ್ಗಾಗಿ ನಿಯತಾಂಕಗಳ ಉಪ-ಸಮೂಹ ಮಾತ್ರ ಸಕ್ರಿಯಗೊಳ್ಳುತ್ತದೆ, ಇದು ಕಂಪ್ಯೂಟೇಶನಲ್ ವೆಚ್ಚವನ್ನು ಗಣನೀಯವಾಗಿ ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.
Qwen3.5-Flash ವೇಗ-ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ವೇರಿಯಂಟ್ ಆಗಿದೆ, ಇದು ಕಡಿಮೆ ಸುಪ್ತತೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಥ್ರೋಪುಟ್ ನಿರ್ಣಾಯಕವಾದ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಇದು ಚಾಟ್ಬಾಟ್ಗಳು, ವಿಷಯ ರಚನೆ ಮತ್ತು ಸಾಮಾನ್ಯ ಭಾಷಾ ಕಾರ್ಯಗಳಿಗೆ ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿ ಪರಿಹಾರವಾಗಿ ಸ್ಥಾನ ಪಡೆದಿದೆ, ಅಲ್ಲಿ ಗರಿಷ್ಠ ತಾರ್ಕಿಕ ಆಳಕ್ಕಿಂತ ತಕ್ಷಣದ ಪ್ರತಿಕ್ರಿಯೆಗಳು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿರುತ್ತವೆ.
Qwen3.5-35B-A3B ಮಾದರಿಯು 35 ಶತಕೋಟಿ ಒಟ್ಟು ನಿಯತಾಂಕಗಳೊಂದಿಗೆ ಸ್ಪಾರ್ಸ್ MoE ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸುತ್ತದೆ ಆದರೆ ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ಕೇವಲ 3 ಶತಕೋಟಿ ಮಾತ್ರ ಸಕ್ರಿಯವಾಗಿರುತ್ತವೆ. ಈ ವಿನ್ಯಾಸವು ಅದನ್ನು ಅದರ ಕಂಪ್ಯೂಟೇಶನಲ್ ತೂಕದ ವರ್ಗಕ್ಕಿಂತ ಹೆಚ್ಚು ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ದೊಡ್ಡ ಸಾಂದ್ರತೆಯ ಮಾದರಿಗಳಿಗೆ ಹತ್ತಿರವಿರುವ ಗುಣಮಟ್ಟವನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಇನ್ಫರೆನ್ಸ್ ಕಂಪ್ಯೂಟ್ನ ಒಂದು ಭಾಗವನ್ನು ಮಾತ್ರ ಅಗತ್ಯವಿದೆ.
ಶ್ರೇಣಿಯ ಮೇಲ್ಭಾಗದಲ್ಲಿ Qwen3.5-122B-A10B ಇದೆ, ಇದು 122 ಶತಕೋಟಿ ಒಟ್ಟು ನಿಯತಾಂಕಗಳು ಮತ್ತು ಸುಮಾರು 10 ಶತಕೋಟಿ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿರುವ ದೊಡ್ಡ-ಪ್ರಮಾಣದ ಮಿಕ್ಸ್ಚರ್-ಆಫ್-ಎಕ್ಸ್ಪರ್ಟ್ಸ್ ಮಾದರಿಯಾಗಿದೆ. ಈ ಮಾದರಿಯು ಅತ್ಯಂತ ಬೇಡಿಕೆಯಿರುವ ತಾರ್ಕಿಕ, ಕೋಡಿಂಗ್ ಮತ್ತು ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಕಾರ್ಯಗಳನ್ನು ಗುರಿಯಾಗಿಸುತ್ತದೆ, ಅಲ್ಲಿ Alibaba ಫ್ರಾಂಟಿಯರ್ ವಾಣಿಜ್ಯ ಮಾದರಿಗಳೊಂದಿಗೆ ಸ್ಪರ್ಧಾತ್ಮಕ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೇಳುತ್ತದೆ.
Qwen3.5-27B ಕುಟುಂಬವನ್ನು ಸಾಂದ್ರ ಮಾದರಿಯಾಗಿ ಪೂರ್ಣಗೊಳಿಸುತ್ತದೆ — ಅಂದರೆ 27 ಶತಕೋಟಿ ನಿಯತಾಂಕಗಳು ಇನ್ಫರೆನ್ಸ್ ಸಮಯದಲ್ಲಿ ಸಕ್ರಿಯವಾಗಿರುತ್ತವೆ — ವಿಭಿನ್ನ ಕಾರ್ಯಗಳಲ್ಲಿ ಸ್ಥಿರವಾದ ಕಾರ್ಯಕ್ಷಮತೆ ಯಾವುದೇ ಒಂದು ಆಯಾಮದಲ್ಲಿ ಗರಿಷ್ಠ ದಕ್ಷತೆಗಿಂತ ಹೆಚ್ಚು ಮುಖ್ಯವಾದ ಕಾರ್ಯಭಾರಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.
ಓಪನ್ ಮಾದರಿ ತಂತ್ರ
Qwen 3.5 ಅನ್ನು ಓಪನ್ ಮಾದರಿಗಳಾಗಿ ಬಿಡುಗಡೆ ಮಾಡಲು Alibaba ನಿರ್ಧಾರವು ಒಂದು ವ್ಯೂಹಾತ್ಮಕ ಆಯ್ಕೆಯಾಗಿದೆ, ಇದು OpenAI ಮತ್ತು, ಒಂದು ಮಟ್ಟಿಗೆ, Anthropic ಆದ್ಯತೆ ನೀಡುವ ಕ್ಲೋಸ್ಡ್-ಸೋರ್ಸ್ ವಿಧಾನಗಳಿಂದ ಇದನ್ನು ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ. ತೂಕಗಳನ್ನು (weights) ಉಚಿತವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡುವುದರ ಮೂಲಕ, Alibaba ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ಸ್ವೀಕಾರ ಮತ್ತು ಕೆಳಹಂತದ ನಾವೀನ್ಯತೆಗಳು ಮಾಲಿಕತ್ವದ ಮಾದರಿಗಳನ್ನು ಇಡುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಿನ ಮೌಲ್ಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತವೆ ಎಂದು ಬಾಜಿ ಹಾಕುತ್ತಿದೆ.
ಈ ವಿಧಾನವು ಈಗಾಗಲೇ Qwen ಕುಟುಂಬಕ್ಕೆ ಲಾಭಗಳನ್ನು ತಂದುಕೊಟ್ಟಿದೆ. ಹಿಂದಿನ Qwen ಬಿಡುಗಡೆಗಳು ಓಪನ್-ಸೋರ್ಸ್ ಸಮುದಾಯದಲ್ಲಿ ವ್ಯಾಪಕವಾಗಿ ಸ್ವೀಕರಿಸಲ್ಪಟ್ಟಿವೆ, ವಿಶೇಷ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗಾಗಿ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ ಮತ್ತು ಮುಚ್ಚಿದ API ಒದಗಿಸುವವರ ಮೇಲೆ ಅವಲಂಬಿತರಾಗಲು ಸಾಧ್ಯವಾಗದ ಅಥವಾ ಆಯ್ಕೆ ಮಾಡದ ಕಂಪನಿಗಳಿಂದ ವಾಣಿಜ್ಯ ಉತ್ಪನ್ನಗಳಲ್ಲಿ ಸಂಯೋಜಿಸಲ್ಪಟ್ಟಿವೆ. ಪ್ರತಿ ಹೊಸ ಬಿಡುಗಡೆಯು ಓಪನ್-ವೇಟ್ಸ್ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ Meta ನ Llama ಕುಟುಂಬಕ್ಕೆ Alibaba ದ ಡಿ ಫ್ಯಾಕ್ಟೋ ಪರ್ಯಾಯವಾಗಿ ಅದರ ಸ್ಥಾನವನ್ನು ಬಲಪಡಿಸುತ್ತದೆ.
ಬಿಡುಗಡೆಯ ಸಮಯವೂ ಮಹತ್ವದ್ದಾಗಿದೆ. AI ಉದ್ಯಮವು ಓಪನ್ ಮಾದರಿಗಳು ಮುಚ್ಚಿದ ಫ್ರಾಂಟಿಯರ್ ಸಿಸ್ಟಮ್ಗಳೊಂದಿಗೆ ನಿಜವಾಗಿಯೂ ವೇಗವನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಬಹುದೇ ಎಂಬ ಪ್ರಶ್ನೆಗಳೊಂದಿಗೆ ಹೋರಾಡುತ್ತಿರುವಾಗ ಇದು ಬರುತ್ತದೆ. Qwen 3.5 ನೊಂದಿಗೆ, Alibaba ಅವುಗಳು ಮಾಡಬಲ್ಲವು — ಮತ್ತು ಗಮನಾರ್ಹವಾಗಿ ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ — ಎಂದು ಆಕ್ರಮಣಕಾರಿಯಾಗಿ ವಾದಿಸುತ್ತಿದೆ.
ವೆಚ್ಚದ ಪ್ರಯೋಜನ ಮತ್ತು ಮಾರುಕಟ್ಟೆ ಪರಿಣಾಮಗಳು
ವೆಚ್ಚದ ವಾದವು Alibaba ನ ಪ್ರಸ್ತುತಿಗೆ ಕೇಂದ್ರವಾಗಿದೆ. ಉದ್ಯಮಗಳು ತಮ್ಮ AI ನಿಯೋಜನೆಗಳನ್ನು ಪ್ರಾಯೋಗಿಕ ಮೂಲಮಾದರಿಗಳಿಂದ ದಿನಕ್ಕೆ ಲಕ್ಷಾಂತರ ವಿನಂತಿಗಳನ್ನು ಸಂಸ್ಕರಿಸುವ ಉತ್ಪಾದನಾ ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಅಳೆಯುವಾಗ, OpenAI ಮತ್ತು Anthropic ನಂತಹ ಒದಗಿಸುವವರಿಂದ API ವೆಚ್ಚಗಳು ವೇಗವಾಗಿ ಹೆಚ್ಚಾಗಬಹುದು. ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಮಾಡಬಹುದಾದ ಓಪನ್ ಮಾದರಿಗಳು ಪ್ರತಿ-ಟೋಕನ್ ಶುಲ್ಕವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ತೆಗೆದುಹಾಕುತ್ತವೆ, ಅವುಗಳನ್ನು ಸ್ಥಿರ ಮೂಲಸೌಕರ್ಯ ವೆಚ್ಚಗಳೊಂದಿಗೆ ಬದಲಾಯಿಸುತ್ತವೆ, ಇದು ಪ್ರಮಾಣದಲ್ಲಿ ಹೆಚ್ಚು ಆರ್ಥಿಕವಾಗುತ್ತದೆ.
ಮಿಕ್ಸ್ಚರ್-ಆಫ್-ಎಕ್ಸ್ಪರ್ಟ್ಸ್ ವಾಸ್ತುಶಿಲ್ಪವು ಈ ಪ್ರಯೋಜನವನ್ನು ಮತ್ತಷ್ಟು ಹೆಚ್ಚಿಸುತ್ತದೆ. ಪ್ರತಿ ಇನ್ಫರೆನ್ಸ್ ಕರೆಗೆ ಒಟ್ಟು ನಿಯತಾಂಕಗಳಲ್ಲಿ ಒಂದು ಭಾಗವನ್ನು ಮಾತ್ರ ಸಕ್ರಿಯಗೊಳಿಸುವ ಮೂಲಕ, MoE ಮಾದರಿಗಳು ಸಮಾನ ಗುಣಮಟ್ಟದ ಸಾಂದ್ರ ಮಾದರಿಗಳಿಗಿಂತ ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆ-ಪ್ರತಿ-ಡಾಲರ್ ನೀಡುತ್ತವೆ. GPU ಕ್ಲಸ್ಟರ್ಗಳಲ್ಲಿ AI ಕಾರ್ಯಭಾರಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಕಂಪನಿಗಳಿಗೆ, ಇದು ನೇರವಾಗಿ ಕಡಿಮೆ ಹಾರ್ಡ್ವೇರ್ ಅವಶ್ಯಕತೆಗಳಿಗೆ ಅಥವಾ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಮೂಲಸೌಕರ್ಯದಲ್ಲಿ ಹೆಚ್ಚಿನ ಥ್ರೋಪುಟ್ಗೆ ಅನುವಾದಿಸುತ್ತದೆ.
AI ಭೂದೃಶ್ಯಕ್ಕೆ ಇದರ ಅರ್ಥವೇನು
Qwen 3.5 ರ ಬಿಡುಗಡೆಯು 2025 ಮತ್ತು 2026 ರ ಉದ್ದಕ್ಕೂ ವೇಗಗೊಳ್ಳುತ್ತಿರುವ ಒಂದು ಪ್ರವೃತ್ತಿಯನ್ನು ಬಲಪಡಿಸುತ್ತದೆ: ಓಪನ್ ಮತ್ತು ಕ್ಲೋಸ್ಡ್ ಮಾದರಿಗಳ ನಡುವಿನ ಅಂತರವು ಅನೇಕರು ಊಹಿಸಿದ್ದಕ್ಕಿಂತ ವೇಗವಾಗಿ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ. ಫ್ರಾಂಟಿಯರ್ ಕ್ಲೋಸ್ಡ್ ಮಾದರಿಗಳು ಒಮ್ಮೆ ಸಾಮರ್ಥ್ಯದಲ್ಲಿ ಪ್ರಬಲ ಮುನ್ನಡೆ ಹೊಂದಿದ್ದವು, ಅಲ್ಲಿ ಓಪನ್ ಪರ್ಯಾಯಗಳು ಈಗ ಹೆಚ್ಚಿನ ಮಾನದಂಡಗಳಲ್ಲಿ ಹೊಡೆಯುವ ದೂರದಲ್ಲಿವೆ, ಆದರೆ ವೆಚ್ಚ, ಗ್ರಾಹಕೀಕರಣ ಮತ್ತು ಡೇಟಾ ಗೌಪ್ಯತೆಯಲ್ಲಿ ಪ್ರಯೋಜನಗಳನ್ನು ನೀಡುತ್ತವೆ, ಇದನ್ನು ಮುಚ್ಚಿದ API ಗಳು ಹೊಂದಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ.
ಅವರ AI ತಂತ್ರಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಉದ್ಯಮಗಳಿಗೆ, Qwen 3.5 ಕುಟುಂಬವು GPT-5 mini, Claude Sonnet 4.5, ಮತ್ತು Meta ನ Llama 4 ಸರಣಿಯೊಂದಿಗೆ ಗಂಭೀರ ಪರಿಗಣನೆಗೆ ಅರ್ಹವಾದ ಆಕರ್ಷಕ ಆಯ್ಕೆಯನ್ನು ನೀಡುತ್ತದೆ. ಅತ್ಯಾಧುನಿಕ AI ಸಾಮರ್ಥ್ಯಗಳ ವೆಚ್ಚವು ಕಡಿಮೆಯಾಗುತ್ತಲೇ ಇರುವುದರಿಂದ, ಅವರ ಬೆಲೆ ಪ್ರೀಮಿಯಂ ಅನ್ನು ಸಮರ್ಥಿಸಲು ಮುಚ್ಚಿದ-ಮೂಲ ಒದಗಿಸುವವರ ಮೇಲಿನ ಒತ್ತಡವು ಹೆಚ್ಚಾಗುತ್ತದೆ.
ಈ ಲೇಖನವು The Decoder ನ ವರದಿಗಳ ಆಧಾರದ ಮೇಲೆ ಇದೆ. ಅಸಲಿ ಲೇಖನವನ್ನು ಓದಿ.


