ಗುರುವಾರ , ಏಪ್ರಿಲ್ 22, 2021
31 °C

ಯುನಿಕೋಡ್: ಮಿಥ್ಯೆ ಮತ್ತು ವಾಸ್ತವ

ಡಾ. ಯು.ಬಿ. ಪವನಜ Updated:

ಅಕ್ಷರ ಗಾತ್ರ : | |

ಗಣಕಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಲು ಬಳಸುವ ಸಂಕೇತೀಕರಣ ವ್ಯವಸ್ಥೆಯೇ ಯುನಿಕೋಡ್. ಇದರ ವೈಶಿಷ್ಟ್ಯವೆಂದರೆ ಜಗತ್ತಿನ ಎಲ್ಲ ಭಾಷೆಗೂ ಇದರಲ್ಲಿ ಪ್ರತ್ಯೇಕ ಸಂಕೇತವನ್ನು ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಇಂಗ್ಲೀಶ್‌ನ ಜಾಗದಲ್ಲಿ ಕನ್ನಡವನ್ನು ಕೂರಿಸಬೇಕಾಗಿಲ್ಲ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಸಂಗ್ರಹಿಸಿದ ಮಾಹಿತಿಯನ್ನು ಪರದೆಯಲ್ಲಿ (monitor) ಸರಿಯಾಗಿ ತೋರಿಸಲು ಓಪನ್‌ಟೈಪ್ ಎಂಬ ವಿಧಾನದ ಅಕ್ಷರಶೈಲಿಯನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ. ಈ ಅಕ್ಷರಶೈಲಿಯ ವಿಶೇಷವೆಂದರೆ ಎಷ್ಟು ಬೇಕಾದರೂ ಅಕ್ಷರಭಾಗಗಳನ್ನು ಬಳಸಬಹುದು. ಅಷ್ಟು ಮಾತ್ರವಲ್ಲ- ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಶೇಖರಿಸುವುದರಿಂದ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲು ಸಾಧ್ಯ.



ಯುನಿಕೋಡ್ ಮಾಹಿತಿಯನ್ನು ಕಾರ್ಯಾಚರಣೆ ವ್ಯವಸ್ಥೆಗಳು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದರಿಂದ ಕಡತಗಳಲ್ಲಿ ಸಂಗ್ರಹವಾದ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕಬಹುದು. ಪತ್ರಿಕೆಗಳು ಯುನಿಕೋಡ್ ಬಳಸಿ ಕಡತ ತಯಾರಿ ಮಾಡಿದರೆ ನಿರ್ದಿಷ್ಟ ವಿಷಯದ ಬಗ್ಗೆ ಮಾಹಿತಿ ಯಾವ ಕಡತದಲ್ಲಿದೆ ಎಂದು ಸುಲಭವಾಗಿ ಹುಡುಕಿ ತೆಗೆಯಬಹುದು. ಅಂತರ್ಜಾಲದಲ್ಲಿ ಮಾಹಿತಿ ಹುಡುಕುವ ತಾಣವಾದ ‘ಗೂಗ್ಲ್’ (google.co.in) ಕೂಡ ಯುನಿಕೋಡ್ ಮೂಲಕವೇ ಕನ್ನಡದ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕುತ್ತದೆ. ಕರ್ನಾಟಕ ಸಾಹಿತ್ಯ ಅಕಾಡೆಮಿಯವರು ತಮ್ಮ ಜಾಲತಾಣದಲ್ಲಿ ತುಂಬ ಮಾಹಿತಿ ನೀಡಿದ್ದರೂ ಅವು ಯಾವುವೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಇಲ್ಲದಿರುವ ಕಾರಣ ‘ಗೂಗ್ಲ್’ನಲ್ಲಿ ಹುಡುಕಿದರೆ ಸಿಗುವುದಿಲ್ಲ.



ಯುನಿಕೋಡ್ ಅನ್ನುವುದು ಕನ್ನಡ ಗಣಕೀಕರಣದ ಎಲ್ಲ ಸಮಸ್ಯೆಗಳಿಗೆ ಪರಿಹಾರ ನೀಡುವ ಮಾಂತ್ರಿಕ ದಂಡವಲ್ಲ. ಅದು ನಿಂತ ನೀರಲ್ಲ. ಆಗಾಗ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಸುಧಾರಣೆಗಳು ಆಗುತ್ತಲೇ ಇರುತ್ತವೆ. ಯುನಿಕೋಡ್ ಕನ್ಸೋರ್ಶಿಯಂನಲ್ಲಿ ಭಾರತ ಸರಕಾರವೂ ಸದಸ್ಯತ್ವ ಪಡೆದಿದೆ. ನಮ್ಮ ಭಾಷೆ ಹೀಗೆಯೇ ಇರಬೇಕು ಎಂದು ಯುನಿಕೋಡ್ ಕನ್ಸೋರ್ಶಿಯಂಗೆ ಯಾರು ಬೇಕಾದರೂ ಪತ್ರ ಬರೆಯಬಹುದು. ಅವರ ಚರ್ಚಾ ವೇದಿಕೆಗಳಲ್ಲಿ ಭಾಗವಹಿಸಬಹುದು.



ಕೆಲವರಲ್ಲಿ ಯುನಿಕೋಡ್ ಬಗ್ಗೆ ಇರುವ ತಪ್ಪು ಅಭಿಪ್ರಾಯಗಳು ಯಾವುವು ಮತ್ತು ನಿಜ ಸಂಗತಿ ಏನು ಎನ್ನುವುದನ್ನು ತಿಳಿದುಕೊಳ್ಳೋಣ:



‘ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಕನ್ನಡದ ಅಕ್ಷರಗಳು ಸರಿಯಾಗಿ ಮೂಡಿ ಬರುವುದಿಲ್ಲ. ಮೂರು ಎಂದು ಬೆರಳಚ್ಚು ಮಾಡಿದರೆ ಮಾರು ಎಂದು ಮೂಡಿಬರುತ್ತದೆ’.



ಇದು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಆರಂಭದಲ್ಲಿ ನೀಡಿದ್ದ ‘ತುಂಗ’ ಹೆಸರಿನ ಫಾಂಟ್‌ನಲ್ಲಿದ್ದ ಸಮಸ್ಯೆ. ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರು 2001ರಲ್ಲಿ ತಮ್ಮ ವಿಂಡೋಸ್ ಎಕ್ಸ್‌ಪಿ ಕಾರ್ಯಾಚರಣೆಯ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ (ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್) ಪ್ರಥಮ ಬಾರಿಗೆ ಕನ್ನಡ ಅಳವಡಿಸಿದರು. ಆಗ ಕನ್ನಡ ಲಿಪಿಗೆ ‘ತುಂಗ’ ಹೆಸರಿನ ಫಾಂಟ್ ನೀಡಿದ್ದರು. ಅದರಲ್ಲಿ ಈ ಸಮಸ್ಯೆ ಇತ್ತು. 2003ರಲ್ಲಿ ವಿಂಡೋಸ್ 2003 ಬಿಡುಗಡೆಯಾದಾಗ ‘ತುಂಗ’ ಫಾಂಟಿನ ಸಮಸ್ಯೆಯನ್ನು ಸರಿಪಡಿಸಿ ಸುಧಾರಿತ ಫಾಂಟ್ ಹೊರತಂದರು.



ಆದುದರಿಂದ ಇದು ಯುನಿಕೋಡ್ ಸಮಸ್ಯೆಯಲ್ಲ. ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕಂಪೆನಿಯವರ ‘ತುಂಗ’ ಫಾಂಟಿನ ಸಮಸ್ಯೆ. ಗಣಕದಲ್ಲಿ ಶೇಖರಿಸಲಾದ ಮಾಹಿತಿಯನ್ನು ಪರದೆಯ ಮೇಲೆ ಮೂಡಿಸಲು ಈ ಅಕ್ಷರಶೈಲಿ ಅರ್ಥಾತ್ ಫಾಂಟ್ ಬೇಕು. ಯುನಿಕೋಡ್ ಮೂಲಕ ದಾಖಲಿಸಿದ ಮಾಹಿತಿಯನ್ನು ತೋರಿಸಲು ಓಪನ್‌ಟೈಪ್ ವಿಧಾನದ ಅಕ್ಷರಶೈಲಿ ಬೇಕು. ‘ತುಂಗ’ ಎನ್ನುವುದು ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರು ನೀಡಿದ ಕನ್ನಡ ಭಾಷೆಯ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್. ಅಂತರಜಾಲದಲ್ಲಿ ಇನ್ನೂ ಹಲವು ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳು ಲಭ್ಯವಿವೆ. ನೀವು ಯಾವುದನ್ನು ಬೇಕಾದರೂ ಬಳಸಬಹುದು.



‘ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ರ್ಯಾಂಕ್ ಎಂದು ಬೆರಳಚ್ಚು ಮಾಡಿದರೆ ಯಾರ್ಂಕ್ ಎಂದು ಮೂಡಿಬರುತ್ತದೆ’.ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಅಳವಡಿಸುವಾಗ ದೇವನಾಗರಿ ಲಿಪಿಯನ್ನು ಆಧಾರವಾಗಿಟ್ಟುಕೊಂಡು ಇತರೆ ಭಾಷೆಗಳಿಗೆ ಸೂತ್ರ ನಿರ್ಮಿಸಿದರು. ಅದರ ಪ್ರಕಾರ <ರ> + <ವ್ಯಂಜನ> ಬಂದಾಗ ವ್ಯಂಜನ> <ಅರ್ಕಾವತ್ತು> ಬರತಕ್ಕದ್ದು. ಇದಕ್ಕೆ ಅಪವಾದವೆಂದರೆ <ವ್ಯಂಜನ> ವು <ರ> ಆಗಿದ್ದಾಗ <ರ> <ರ ಒತ್ತು> ಬರತಕ್ಕದ್ದು. ಅಂದರೆ <ರ> + <ಕ> = ರ್ಕ ಮತ್ತು <ರ> + <ರ> = ರ್ರ. ಆದರೆ ಇಲ್ಲವರು ಒಂದು ಸಣ್ಣ ಅಂಶಕ್ಕೆ ಗಮನ ಕೊಡಲಿಲ್ಲ.



ಅದೆಂದರೆ ಒಂದು ಪದದ ಪ್ರಾರಂಭದಲ್ಲಿಯೇ ಈ <ರ> ಬಂದರೆ ಎರಡನೆ ಸೂತ್ರ (<ವ್ಯಂಜನ> ಕ್ಕೆ <ರ ಒತ್ತು>) ಬರತಕ್ಕದ್ದು ಎಂದು. ಈ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್‌ನವರು ತಮ್ಮ PR-37ರಲ್ಲಿ ಪರಿಹಾರ ಸೂಚಿಸಿದ್ದಾರೆ. ಆಸಕ್ತರು ಯುನಿಕೋಡ್ ತಾಣದಲ್ಲಿ (http://www.unicode.org/review/pr-37.pdf ) ಪೂರ್ಣ ವಿವರ ನೋಡಬಹುದು. ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರು ತಮ್ಮ ವಿಂಡೋಸ್ ವಿಸ್ಟ ಮತ್ತು 7ರಲ್ಲಿದನ್ನು ಅಳವಡಿಸಿದ್ದಾರೆ.



‘ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಅರ್ಕಾವೊತ್ತೇ ಬರುತ್ತದೆ. ರ ಒತ್ತು (  ್ರ ) ಬರುವುದೇ ಇಲ್ಲ. ಉದಾಹರಣೆಗೆ ತರ್ಕ ಎಂದೇ ಆಗುತ್ತದೆ. ತರ್ಕ ಎಂದು ಬರುವುದೇ ಇಲ್ಲ’.



ಇದೂ ಕೂಡ ಮೇಲೆ ತಿಳಿಸಿದ ಸಮಸ್ಯೆಯೇ. ಪರಿಹಾರವೂ ಮೇಲೆ ತಿಳಿಸಿದ ಕ್ಕೃ37ರಲ್ಲಿ ಇದೆ. ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ವಿಂಡೋಸ್ ವಿಸ್ಟ ಮತ್ತು 7ರಲ್ಲಿ ಇದನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ.



‘ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ ಸರಿಯಿಲ್ಲ. ‘ಯ, ರ, ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ’ ಎಂದೇ ಇದೆ’.

ಇದು ಯುನಿಕೋಡ್‌ನ ಆವೃತ್ತಿ 3 ರಲ್ಲಿ ಇದ್ದ ಸಮಸ್ಯೆ. ಯುನಿಕೋಡ್‌ನ ಆವೃತ್ತಿ 4ರಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯನ್ನು ಸರಿಪಡಿಸಲಾಗಿದೆ. ಈಗ ಅದು ‘ಯ, ರ, ಱ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ, ೞ’ ಎಂದೇ ಇದೆ. ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ಎಲ್ಲ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ ಈ ಸೂತ್ರವನ್ನು ಅಳವಡಿಸಿಕೊಂಡು ಸರಿಯಾಗಿದೆ. ಆದುದರಿಂದ ಯುನಿಕೋಡ್ ಬಳಸಿ ಕನ್ನಡದ ದತ್ತಸಂಚಯ (ಡಾಟಾಬೇಸ್) ತಯಾರಿಸಲು ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲ.

‘ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ‘ನುಡಿ’ ಕೀಬೋರ್ಡ್ ಇಲ್ಲ’.



ಯುನಿಕೋಡ್‌ಗೂ ಕೀಲಿಮಣೆಗೂ ಯಾವ ಸಂಬಂಧವೂ ಇಲ್ಲ. ಯುನಿಕೋಡ್ ಎನ್ನುವುದು ಅಕ್ಷರಗಳ ಶೇಖರಣೆ ಮತ್ತು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇರುವ ಸೂತ್ರಗಳು. ಕೀಲಿಮಣೆಯು ಕಾರ್ಯಾಚರಣೆಯ ವ್ಯವಸ್ಥೆಗೆ ಸಂಬಂಧಿಸಿದ್ದು. ಬಹುಜನರು ಬಳಸುವ ಮೈಕ್ರೋಸಾಫ್ಟ್ ವಿಂಡೋಸ್‌ನ ಎಕ್ಸ್‌ಪಿ ನಂತರದ ಎಲ್ಲ ಆವೃತ್ತಿಗಳಲ್ಲಿ ಕೇಂದ್ರ ಸರಕಾರದವರು ನಿಗದಿಪಡಿಸಿರುವ ಇನ್‌ಸ್ಕ್ರಿಪ್ಟ್ ಕೀಲಿಮಣೆ ವಿನ್ಯಾಸವನ್ನು ನೀಡಲಾಗಿದೆ. ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರದೇ ಆದ www.bhashaindia.com  ತಾಣದಿಂದ ಹೆಚ್ಚಿನ ಕೀಲಿಮಣೆ ವಿನ್ಯಾಸಗಳನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿಕೊಳ್ಳಬಹುದು. ಇದರಲ್ಲಿ ಕರ್ನಾಟಕ ಸರ್ಕಾರವು ನಿಗದಿಪಡಿಸಿರುವ ವಿನ್ಯಾಸವೂ (ನುಡಿ) ಇದೆ. ಲಿನಕ್ಸ್‌ನಲ್ಲೂ ಈ ವಿನ್ಯಾಸಗಳು ಲಭ್ಯವಿವೆ.



ಮೇಲೆ ತಿಳಿಸಿದ ಎಲ್ಲ ಸಮಸ್ಯೆಗಳನ್ನು ಲಿನಕ್ಸ್‌ನವರು ಈಗಾಗಲೇ ಪರಿಹರಿಸಿಕೊಂಡಿದ್ದಾರೆ. ಸಾರಾಂಶ ರೂಪದಲ್ಲಿ ಹೇಳುವುದಾದರೆ ಈ ರೀತಿ ಸುಳ್ಳು ವದಂತಿಗಳನ್ನು ಹಬ್ಬಿಸುವವರಿಗೆ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಮತ್ತು ಯುನಿಕೋಡ್‌ಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ ಗೊತ್ತಿಲ್ಲ. ಯುನಿಕೋಡ್ ಅನ್ನುವುದು ಒಂದು ಶಿಷ್ಟತೆ. ಮೈಕ್ರೋಸಾಫ್ಟ್ ಯುನಿಕೋಡ್ ಅನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವ ಒಂದು ಕಂಪೆನಿ ಅಷ್ಟೇ.

ಕೇಂದ್ರ ಬಜೆಟ್ 2021 ಪೂರ್ಣ ಮಾಹಿತಿ ಇಲ್ಲಿದೆ

ತಾಜಾ ಸುದ್ದಿಗಳಿಗಾಗಿ ಪ್ರಜಾವಾಣಿ ಆ್ಯಪ್ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿಕೊಳ್ಳಿ: ಆಂಡ್ರಾಯ್ಡ್ ಆ್ಯಪ್ | ಐಒಎಸ್ ಆ್ಯಪ್

ಪ್ರಜಾವಾಣಿ ಫೇಸ್‌ಬುಕ್ ಪುಟವನ್ನುಫಾಲೋ ಮಾಡಿ.